





Die Humankybernetik (Anthropokybernetik) umfaßt alle jene Wissenschaftszweige, welche nach 
dem Vorbild der neuzeitlichen Naturwisseschaft versuchen, Gegenstände, die bisher ausschließlich 
mit 'geisteswissenschaftlichen. Methoden bearbeitet wurden, auf Modelle abzubilden und mathema- 
tisch zu analysieren. Zu den Zweigen der Humankybernetik gehören vor allem die Informations- 
psychologie (einschließlich der Kognitionsforsehung, der Theorie über „künstliche Intelligenz“ 
und. der modellierenden Psychopathometrie und Geriatrie), die Informationsästhetik und die 
kybernetische Pädagogik, aber auch die Sprachkybernetik (einschließlich der Textstatistik, 
der mathematischen Linguistik und der konstruktiven Interlinguistik) sowie die Wirtschafts-, So- 
zialund Rechtskybernetik. - Neben diesem ihrem hauptsächlichen Themenbereich pflegen die 
GrKG/Humankybernetik durch gelegentliche Übersichtsbeiträge und interdisziplinär interessieren- 
de Originalarbeiten auch die ‚drei anderen Bereiche der kybernetischen Wissenschaft: die Bioky- 
bernetik, die Ingenieurkybernetik und die Allgemeine Kybernetik (Strukturtheorie infor- 
mationeller Gegenstinde). Nicht zuletzt wird auch metakybernetischen Themen Raum gege- 
ben: nicht nur der Philosophie und Geschichte der Kybernetik, sondern auch der auf kybernetische 
Inhalte bezogenen Padagogik und Literaturwissenschaft. - 


La prihoma kibernetiko (antropokibernetiko) inkluzivas ĉiujn tiajn sciencobranĉojn, kiuj imitante 
la novepokan natursciencon, klopodas bildigi per modeloj kaj analizi matematike objektojn ĝis nun 
pritraktitajn ekskluzive per kultursciencaj metodoj. Apartenas al la branĉaro de la antropokibernet- 
iko ĉefe la kibernetika psikologio (inkluzive la ekkon-esploron, la teoriojn pri „artefarita inte- 
lekto “.kaj la modeligajn psikopatometrion kaj geriatrion), la kibernetika estetiko kaj la kiber- 
netika pedagogio, sed ankaŭ la lingvokibernetiko (inkluzive la tekststatisikon, la matemati- 
kan lingvistikon kaj la konstruan interlingvistikon) same kiel la kibernetika ekonomio, lasoci- 
kibernetiko kaj la jnrkibernetiko. - Krom tiu ĉi sia ĉefa temaro per superrigardaj artikoloj kaj 
interfake interesigaj originalaj laboraĵoj GrKG/HUMANKYBERNETIK flegas okaze ankaŭ la tri 
aliajn kampojn de la kibernetika scienco: la biokibernetikon, lainĝenierkibernetikon kaj la 
ĝeneralan kibernetikon (strukturteorion de informecaj objektoj). Ne lastavice trovas lokon an- 
kaŭ metakibernetikaj temoj: ne nur la filozofio kaj historio de la kibernetiko, sed ankaŭ la pe- 
dagogio kaj literaturscienco de kibernetikaj sciaĵoj. - & 


Cybernetics of Social Systems comprises all those branches of science which apply mathematical 
models and methods of analysis to matters which had previously been the exclusive domain of the 
hümanities. -Above all this includes information psychology (including theories of cognition and 
“artificial intelligence” -as well as -psychopathometrics ‘and geriatrics), aesthetics of information 
and: cybernetic educational theory, cybernetic linguistics (including text-statistics, mathematical 
linguistics and constructive interlinguistics) as well as economic, social and juridical cybernetics.. - 
in addition to its principal areas of interest, the GrKG/HUMANKYBERNETIR offers a forum for 
the publication of articles of a general nature in three other fields: biocybernetics, cybernetic engi- 
neering and general cybernetics (theory of informational structure). There is also room for metacy- 
bernetic subjects: not just the history and philosophy of cybernetics but also cybernetic approa- 
ches to education and literature are welcome. 


La cybernetique sociale contieni tous le branches scientifiques, qui cherchent -a imiter les sciences naturelles 
modernes en projetant sur des modeles et en analysant de mäniere mathematique des objets, qui ĉtaient traites 
auparavant exclusivemient par des methodes des sciences culturelles (“idĉographiques”). Parmi les branches de 
la ĉybernetique sociale il y a en premier lieu la psychologie informationelle (inclues la recherche de la cognition, 
les thĉories de [intelligence artificielle ei la psychopathomĉtrie et gĉriatrie modeliste), l'esthetique informationelle 
et -la pedagogie eybernetique, mais aussi la cybernĉtique linguistique (incluos la statistique de textes, la linguistique 
mathematique et Üinterlinguistique constructive) ainsi que la cybernetique en ĉconomie, sociologie et jurisprudence. 
En plus de ĉes principaŭx ĉentres d'iniĉrĉi la revue HUMANK YBERNETIK s'occupe — par quelques articles de 
synthese -et des travaux originaux d inieret interdisciplinaire — ĉgalement des trois autres champs de la science 
cybernetique: la biocybernetique, la (ybernĉtique de l'ingĉnieur et la cybernĉtique generale (thĉorie des structures 
des objets informatiönels). Une place est ĉealement accordee aux sujeis metacybernetiques mineurs: la philosophie 
et Uhistoire de la ĉybernĉtique mais aussi la pedagogie dans la mesure ou elle concernent la cybernetique. 
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Zählungen zur Phonemhäufigkeitsverteilung des Esperanto 


von Jochem SOTSCHECK, Berlin 


Forschungsinstitut der Deutschen Bundespost, Außenstelle Berlin 


1 Einführung 


Für die Messung der Sprachverständlichkeit, einem Merkmal zur Beurteilung der 
Sprachübertragungsgüte in der Nachrichtentechnik, werden seit vielen Jahrzehnten als 
Testsprachproben neben anderen Sprachbeispielen sogenannte Esperanto-Logatome 
verwendet (CCIT, 0.J.). Unter Logatomen versteht man hierbei bestimmte, nach vor- 
gegebenen Bildungsvorschriften aufgestellte, sinnleere Sprachbausteine. Bei der Unter- 
suchung der Eigenschaften dieser Testsprachproben bestand der Wunsch, deren sprach- 
liche Eigenschaften zu analysieren und mit den Eigenschaften bestimmter Sprachen 
zu vergleichen. 

: Für diese Fragestellung sollten bestimmte Aussagen zur Phonologie der Esperanto- 


: Logatome einerseits und zur Phonologie der damit zu vergleichenden Sprachen anderer- 


seits gegenübergestellt werden. Unter den verschiedensten phonologischen Merkmalen 
von Sprachen und Subsprachen sind hierzu Phoneminventar und Auftrittshäufigkeit 
dieser Phoneme die bedeutungsvollsten. Neben Vergleichen mit den wichtigen Ver- 
kehrssprachen Englisch und Französisch sollten die Esperanto-Logatome auch dem 
Esperanto selbst gegenübergestellt werden. 

Nun lagen dem Verfasser weder Angaben zur Phonemhäufigkeitsverteilung des 
Esperanto vor, noch waren derartige Zählergebnisse nachweisbar. Deshalb wurde zu- 
nächst diese engere Fragestellung nach der Phonemhäufigkeitsverteilung des Esperanto 
Ziel eigener Untersuchungen. Die Ergebnisse der daraufhin durchgeführten Phonem- 
zählungen an bestimmten Esperanto-Beispielen, die in Zusammenhang mit der oben 
skizzierten übergeordneten Fragestellung nur indirekt und am Rande erwähnt werden 
konnten (Sotscheck, 1982), sollen nun hier erstmals unter den Aspekten der Text- 
statistik eingehender dargestellt werden. 


2 Vorgehensweise bei den Phonemzählungen 
2.1 Umfang des Zählstoffes 


Zunächst mußten Festlegungen über den zu untersuchenden Umfang des Zählstof- 
fes getroffen werden. Hierzu wurde von bekannten Zählungen der Phonem- und Laut- 
häufigkeit anderer Sprachen ausgegangen. Entsprechende Zählergebnisse lagen vor für 
Deutsch (Meier, 1967), Französisch (Chavasse, 1948; Malĉcot, 1974) sowie Englisch 
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und US-Amerikanisch (Denes, 1963; Dewey, 1950; French, Carter und Koenig, 1930). 
Die untersuchten Sprachtexte umfaßten dabei — soweit angegeben — je Zählung zwi- 
schen 30 000 und 200 000 Sprachlaute. 

Bei der Festlegung des Textumfanges der Zählstichprobe und der Anzahl der zu 
unterscheidenden Sprachelemente muß jeweils die beabsichtigte Verwendung der Zähl- 
ergebnisse beachtet werden. So galten die angeführten Zählungen teils grundlegend 
linguistischen, teils speziell nachrichtentechnischen Fragestellungen. Entsprechend 
wurde einerseits zwischen Sprachlauten unterschieden, es wurden also sehr feine 
Differenzierungen vorgenommen, andererseits Zählungen nur auf unterschiedliche 
Phoneme erstreckt, also ausschließlich die bedeutungsunterscheidenden Sprachlaute 
erfaßt. Bei der Verwendung der Zählergebnisse für Aufgaben der Sprachverständlich- 
keitsbeurteilung in der Nachrichtentechnik ist die Unterscheidung zwischen Phonemen 
die zweckdienlichere, da gerade diese Sprachelemente den Wortsinn ausdrücken, der 
vom Gesprächspartner verstanden werden soll. 

Die Größe der Textstichprobe zur Phonemzählung ist sicherlich auch von der Größe 
des Phoneminventars der betreffenden Sprache abhängig. Während die Sprachen 
Deutsch, Französisch und Englisch jede um 40 bedeutungsunterscheidende Sprachlau- 
te besitzen, weist das Esperanto deutlich weniger Phoneme auf. Werden zwar die 
Diphthonge (vokalische Doppellaute) zu den eigenständigen Phonemen gerechnet, die 
Affrikaten (konsonantische Doppellaute aus Plosiv und Frikativ) aber, wie oft üblich, 
nicht — obwohl gerade sie im Esperanto durch eigene Schriftzeichen dargestellt wer- 
den —, so erhält man 29 Phoneme des Esperanto, also etwa nur dreiviertel der Menge 
des Phoneminventars des Deutschen. Es sollte erwähnt werden, daß beim Esperanto, 
wie bei anderen Sprachen auch, die Zuordnungen der Sprachlaute zu den Phonemin- 
ventaren nicht ganz einheitlich ist und vom Standpunkt des jeweiligen Autors beein- 
fluß wird (siehe z.B. Hölscher, 1965; Janot-Giorgetti, 1982; Wagner, 1964). 

Aus den angeführten Gründen und um bei ausreichender Genauigkeit die Zählung 
in der kurzen zur Verfügung stehenden Zeit durchführen zu können, erschien es zuläs- 
sig, den Zählstoff für die Ermittlung der Phonemhäufigkeit des Esperanto auf insgesamt 
50 000 Phoneme laufenden Textes festzulegen. Der Zählstoff liegt damit in der Nähe 
der Untergrenze des Textumfanges der angeführten anderen Zählungen und besitzt aus 
diesem Grunde unter Berücksichtigong des geringeren Phoneminventars mindestens die 
Genauigkeit dieser Zählungen. 


2.2 Auswahl des Zählstoffs 


Die Textbeispiele zur Berechnung der Phonemhäufigkeitsverteilung des Esperanto 
sollten aus möglichst vielen und unterschiedlichen Quellen ausgewählt werden. So soll- 
ten sie ursprünglich von möglichst vielen Autoren aus unterschiedlichen Zeitepochen 
stammen, ferner sollten die Textbeispiele aus möglichst vielen verschiedenen Ursprungs- 
sprachen in das Esperanto übersetzt worden sein. Um auch durch die Übersetzung die 
Vielfalt der sprachlichen Darstellung möglichst beizubehalten, wurden zur Vermeidung 
von Sprachverflachungen nur solche Textbeispiele für die Zählung ausgewählt, die von 
Übersetzern mit der Muttersprache des jeweiligen Textautors in das Esperanto übertra- 
gen worden waren. Ausnahme war dabei der Textteil aus dem Alten Testament, das 
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von Zamenhof selbst, dem Schöpfer des Esperanto, aus dem Hebräischen in das Espe- 
ranto übersetzt worden war. 

Es wurden als Zähltexte schließlich zehn verschiedene Literaturbeispiele mit je 
5000 Phonemen laufendem Text gewählt, die ursprünglich aus sieben verschiedenen 
Sprachen stammten. Die Textbeispiele stammen aus folgenden Werken: 


Deutsche Texte 
1. Karl Lebrecht Immermann: Der Karneval und die Somnambile (1829) 
2. Stefan Zweig (1881-1942): Die Augen des ewigen Bruders 


Englischer Text 
3. Gilbert Keith Chesterton: The blue cross. Aus: The innocence of Father Brown 
(1911) 


Französische Texte 
4. Guy de Maupassant (1850-1893): Boitelle. Aus: Les contes Normands 
5. Francois Duc de La Rochefoucauld: Reflexions ou sentences et maximes morales 
(1665) 
6. Francois Marie Arouet de Voltaire: Candide ou l’optimisme (1759) 


Norwegischer Text 
7. Knut Hamsun: Victoria (1898) 


Schwedischer Text 
8. August Strindberg: Die Insel der Seligen (1883) 


Spanischer Text 
9. Miguel de Cervantes Saavedra: Novela del curioso impertinente (Novelle von der 
torichten Neugier). 33. Kapitel aus: El ingenioso hidalgo Don Quijote de la 
Mancha (1604) 


Hebräischer Text 
10. Die Bibel: Genesis, Kapitel 6-8 


Die in dieser Aufstellung enthaltenden Veroffentlichungsdaten oder zumindest die an- 
gegebenen Lebensdaten der Autoren weisen auf die vielfältigen Zeitepochen hin, aus 
denen die Literaturbeispiele entnommen wurden. Im Schrifttumsverzeichnis zu diesem 
Aufsatz finden sich weitere bibliographische Angaben zu den Fundstellen des Zähl- 
stoffes. 


2.3 Durchführung der Zählung 


Eine sprachliche Besonderheit des Esperanto liegt darin, daß jedes Phonem nur durch 
ein einziges verabredetes Schriftzeichen wiedergegeben wird, und umgekehrt jedes 
Schriftzeichen im allgemeinen nur eine einzige Lautbedeutung hat. Mehrdeutigkeiten 
in der Aussprache der Buchstabenreihungen, die die Wörter bilden, wie in den meisten 
anderen Sprachen, treten im Esperanto nicht auf. 

Diese Tatsache der eindeutigen Aussprache der Schriftzeichen begünstigt eine Zäh- 
lung der Auftrittshäufigkeiten der Phoneme des Esperanto in starkem Maße, weil sich 
die sonst sehr mühsame Transkription des Schrifttextes in einen phonetischen Text 
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damit erübrigt und sich die Ermittlung der Phonemhäufigkeitsverteilung — unter Be- 
achtung einiger bestimmter Regeln — auf eine Ermittlung der Buchstabenhäufigkeits- 
verteilung beschränkt. Das ist aber, zumal mit Hilfe von Datenverarbeitungsanlagen, 
ohne allzu großen Aufwand relativ einfach auszuführen. 

Die Phonem- bzw. Buchstabenhäufigkeitszählung wurde mit Hilfe eines entsprechen- 
den Programms mit einer Datenverarbeitungsanlage durchgeführt, nachdem von je 
mindestens 5000 laufenden Phonemen jeder Textprobe ein Lochstreifen angefertigt 
worden war. Zur Darstellung einiger Phoneme bzw. Phonembündel mußten für die wei- 
tere Verarbeitung bei der Lochstreifenherstellung bestimmte Verabredungen getroffen 
werden (z.B. für die Wiedergabe der Buchstaben mit Accent circonflexe, für die Zäh- 
lung der auch im Esperanto durch zwei Buchstaben dargestellten Diphthonge als nur 
ein einziges Phonem, für die Aufspaltung von einigen Einzelbuchstaben in zwei getrenn- 
te Phoneme usw.). Häufige Wiederholungen von Eigennamen sowie Eigennamen, die 
nicht in das Esperanto übersetzt waren, wurden nicht in die Zähltexte übernommen. 

Als wichtigstes Zählergebnis wurden die Auftrittshäufigkeiten der 29 Phoneme des 
Esperanto in jedem, 5000 laufende Phoneme umfassenden “Volltext” der zehn Text- 
beispiele bestimmt. Die hierbei zwischen den Textbeispielen auftretenden Ergebnis- 
streuungen können möglicherweise auf autorenspezifische Unterschiede in den einzel- 
nen Phonemhäufigkeitsverteilungen hinweisen (über die Auswertung der Zählergeb- 
nisse wird im nächsten Abschnitt berichtet). 

Neben dieser Hauptzählung der Phoneme der Volltexte wurden Teilzählungen an 
Teiltexten aus je 1000 laufenden Phonemen vorgenommen. Die Teilzählungen sollten - 
dazu dienen, Rückschlüsse — möglicherweise auch autorenspezifische — aus der Größe 
der hierbei auftretenden Streubereiche zu ziehen. Um eine Vorstellung vom Umfang = mi 
dieser Teiltexte von je 1000 Phonemen Länge zu vermitteln, sei angegeben, daß diese ; = 
etwa dem Textumfang einer halben Seite DIN A4 mit 1 1/2-zeiliger Schreibmaschinen- == > 
schrift entsprechen. Innerhalb dieses Textumfanges sind sicherlich die individuellen | == = 
Eigenschaften der verwendeten Sprache noch erkennbar. 


3 Zählergebnisse as & 
== : 




















auf Volltext jedes Textbeispiels (5000 Phoneme), Extremalwerte stammen aus Zählungen an Teiltexten (1000 Phoneme). Reihenfolge 








Einen Gesamtüberblick über die Ergebnisse der Untersuchungen zur Phonemhäufig- ——=— 
keitsverteilung an den zehn Textbeispielen des Esperanto, also aus ingesamt 10 x 5000 [ = = Re: 
= 50000 Phonemen, zeigt Bild 1. Hierin ist die Phonemhäufigkeit in Prozent als Funk- —— ui « 
“tion der 29 verschiedenen Phoneme des Esperanto dargestellt. Die Phoneme auf der — aI = 
Abszissenachse sind dabei nach fallender mittlerer Hiufigkeit im Esperanto geordnet. — i 5 
Parameter in diesem Schaubild sind jeweils für jedes einzelne Phonem die Einzelergeb- E ls = 
nisse für die 10 verschiedenen Textproben Volltext. Für jedes Phonem sind durch E 3 
nebeneinanderliegende Ordinatenstrecken diese Teilergebnisse aus jeder der 10 Text- m | ; B 
proben aus je SO00 Phonemen dargestellt. Die Reihenfolge der 10 einander parallelen === | w 2 
Ordiantenstrecken für jedes Phonem entspricht der Reihenfolge 1 bis 10 der Numerie- ———— 5 
rung der oben aufgeführten Werke, aus denen die Textproben entnommen worden === | = = 
sind. Die angegebenen Ordinatenstrecken werden durch die Extremalwerte für die nn LI > 
Phonemhäufigkeiten begrenzt, die bei der 1000-Phoneme-Untersuchung gefunden wur- — “o mw 4 99 ue l 


den, und sie schließen den hervorgehobenen Ordinatenpunkt für den Häufigkeitsmittel- 


Bild 1: Phonemhäufigkeitsverteilung des Esperanto: Mittel- und Extremalwerte der untersuchten zehn Textbeispiele. Mittelwerte beziehen sich 
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Bild 2: Phonemhäufigkeitsverteilung des Esperanto: Mittelwerte aus 50 000 Phonemen (10 ver- 
schiedene Textbeispiele), Extremalwerte aus Teiltextzählungen (1000 Phoneme): Zusammenfassung 
der Ergebnisse aus Bild 1. 


wert ein, der für das betreffende Phonem und für die betreffende Textprobe aus der 
5000-Phoneme-Untersuchung hervorgegangen ist. Die einzelnen Ordinatenstrecken 
geben damit Mittelwerte und den weitesten festgestellten Streubereich bei noch aus- 
reichend langen Textproben für jeden untersuchten Text und für jedes Phonem des 
Esperanto wieder. Für jedes Phonem sind, textunabhängig, weiterhin die äußersten 
überhaupt ermittelten Streuwerte durch horizontale Begrenzungen angegeben. Zwi- 
schen diesen Begrenzungen sind also jeweils sämtliche aus den zehn untersuchten Text- 
beispielen erhaltenen 50 Teiltextergebnisse (aus je 1000 Phonemen) eingeschlossen. 
Was ist aus den dargestellten Ergebnissen zu folgern? Zwischen den zehn untersuch- 
ten Texten sind weder bei den zehn verschiedenen Autoren bzw. den zehn verschiede- 





Zählungen zur Phonemhäufigkeitsverteilung des Esperanto 161 








nen Übersetzern, noch bei den sieben verschiedenen Ursprungssprachen wesentliche 
allgemeine und eindeutige Unterschiede festzustellen. Am meisten weicht noch der 
Text 10 (Bibel) von den Ergebnissen der anderen Texte ab. Bei diesem Textbeispiel 
liegen bei 7 der 29 verschiedenen Phonemen die aus der Untersuchung der gesamten 
Textprobe von 5000 Phonemen errechneten Mittelwerte der Phonemhäufigkeit deut- 
lich über den übrigen Mittelwerten (aus anderen Textbeispielen) desselben Phonems. 
In immerhin 11 Fällen bilden die oberen Extremalwerte dieses Textes 10 die höchsten 
überhaupt bei den betreffenden Phonemen ermittelten Extremalwerte. Bei der Aus- 
wahl dieses Zähltextes wurden die Kapitel mit überproportional starken Häufungen 
bestimmter Textwörter in der Schöpfungsgeschichte (und, Gott, Himmel, Erde) be- 
wußt nicht herangezogen. Trotzdem kann vermerkt werden, daß in der ausgezählten 
Textprobe (Kapitel 6-8 des 1. Buch Mose) diese Wörter dennoch betont häufiger als 
die übrigen auftreten. Eine Nachprüfung ergab jedoch. daß von den in diesen Wörtern 
enthaltenen Phonemen /a/, /I/, /e/, In/, N, lel. 1. PRI, [kl, ld/, [rl (und = /kal/, Gott 
= /di»/, Himmel = /t/le lon/, Erde = /te Ron/) nur die Phoneme /k/ und /s/ zu den in den 
Darstellungen des Bildes 1 auffälligen Phonemen gehören. Eine abgesicherte Erklärung 
für die Ursache der beim Zähltext 10 festgestellten geringfügigen Abweichungen gegen- 
über den Ergebnissen aus den anderen Zähltexten ist also nicht zu geben. 

Eine gewisse Aussagekraft besitzt die für jedes einzelne Phonem ermittelte Streu- 
breite der Phonemhäufigkeit als Ergebnis der Untersuchung von Teiltexten aus je 1000 
Phonemen Länge für jede der zehn ausgewählten Textproben. Wie Bild 1 zeigt, sind 
die an den zehn Textbeispielen ermittelten maximalen Streubreiten der Phonemhäufig- 
keit innerhalb der Ergebnisse für je ein bestimmtes Phonem durchaus nicht einheitlich 
groß. Bestimmte Befunde (sehr große oder sehr kleine Streubreite) sind jedoch nicht 
an eine bestimmte Textprobe gebunden, sondern sind statistisch verteilt. Die — willkür- 
lich — gewählte Länge der Teiltexte von je 1000 laufenden Phonemen ist für eine 
Untersuchung der Textabhängigkeit offensichtlich noch zu klein. Die aus allen 50 Teil- 
texten je Phonem gewonnene maximale Streubreite der Phonemhäufigkeit läßt jedoch 
bereits allgemeine Schlüsse zu. Analog zu anderen Zählergebnissen (Meier, 1967; 
Chavasse, 1948) ist die maximale Streubreite von der absoluten Größe der mittleren 
Phonemhäufigkeit abhängig. Verglichen mit den von Meier für die deutsche Sprache 
ebenfalls mit Teiltexten aus je 1000 Phonemen an insgesamt 100 000 ausgezählten 
Phonemen ermittelten Streubreite sind die für die Phonemhäufigkeit des Esperanto ge- 
fundenen Streubreiten etwa halb so groß wie die für die deutsche Sprache. Der Grund 
hierfür ist offensichtlich das gegenüber dem Deutschen geringere Phoneminventar des 
Esperanto. Die reichere Differenzierungsmöglichkeit der Phonologie des Deutschen 
verursacht offenbar bei gleicher Teiltextlänge der untersuchten Sprachproben beider 
Sprachen eine größere Streuung der Phonemhäufigkeitsteilergebnisse als im Esperanto. 

Eine vereinfachende und zusammenfassende Darstellung der Einzelergebnisse aus 
Bild 1 liefert Bild 2. Es ist hier wieder die Phonemhäufigkeit als Funktion der 29 ver- 
schiedenen Phoneme des Esperanto aufgetragen. Auf der Grundlage des gesamten 
untersuchten Sprachmaterials von 50 000 Phonemen ist ohne Differenzierung nach 
einzelnen Texten die mittlere Phonemhäufigkeitsverteilung des Esperanto dargestellt. 
Außerdem sind die höchsten und niedrigsten Werte der Phonemhäufigkeit angegeben, 
die für die verschiedenen Phoneme bei der Untersuchung aller zehn Texte bei einer 
Teiltextlänge von je 1000 laufenden Phonemen gefunden wurden. Die Phoneme auf 
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der Abszissenachse sind wieder, genau wie in Bild 1, nach fallender mittlerer Hiufig- 
keit im Esperanto angeordnet. Unterhalb der Phonembezeichnungen der Abszissen- 
achse sind für die betreffenden Phoneme entsprechende Beispielwörter angegeben. 


Die Programme zur Ermittlung der Zählergebnisse und die entsprechenden Programmläufe zur 
Phonemzählung mit einer Datenverarbeitungsanlage sind im Rechenzentrum der Forschungsgruppe 
‘Mathematik für Nachrichtentechnik’ des Forschungsinstitutes der Deutschen Bundespost, Darm- 
stadt, entwickelt bzw. durchgeführt worden. Ich möchte hier deren Leiter, Herrn Diplom-Ingenieur 
E. Theissen, für die von ihm geleistete Arbeit und die gute Zusammenarbeit herzlich danken. 
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Counting the phoneme frequency distribution of Esperanto (Summary) 


valuating the linguistic properties of Esperanto logatoms (test words containing special 
= os et ETO SEO for speech intelligibility measurements in telecommuni- 
cations), it was deemed helpful to compare the properties of these test words with those of = 
natural languages. It was also felt that the artificial language Esperanto should be included in ' : 
comparison. The most important features of interest in this study are the constitution of the se 54 
distinctive speech sounds (phonemes) and their FRA kr an - nn This paper deals wi 

indings of an appropriate linguistic analysis of the Esperanto language. u 

er to vesteto the E: frequency distribution of Esperanto, samples consisting of 
5 000 phonemes were taken from ten selected texts of the Esperanto literature. The samples were 
translations from seven languages and had originally been written in very different periods. 

The counted results were separately evaluated both for the fuli length (5 000 phonemes) of a 
samples and for passages consisting of 1 000 phonemes. These investigations gave no evidence ' 
major differences in the frequency of phoneme occurrence which can be attributed to the individ- 

riginal texts. RIO 
= The partial results were combined to obtain a general mean phoneme frequency distribution of 
Esperanto The spread of the frequency countings of the different phonemes, which has been 
derived from the study of texts each consisting of 1 000 phonemes, was shown to have only about 
half the width of the frequency deviation found in German texts. The decrease in the width of 
the individual phoneme frequency countings is assumed to be attributable to the fact that the 
phoneme set of Esperanto is considerably smaller than that of the German language. 




















Noto pri proponita sciencoklasigo por strukturigi sciencan akademion 


de Helmar FRANK, Paderborn (D) 


Kutime la strukturigo de universitatoj kaj 
sciencaj akademioj sekvas (se entute!) scienco- 
klasigon, kiu preteratentas la principan mem- 
starecon de la kibernetiko kaj la daŭran aktu- 
alecon de fenomenologiaj realajsciencoj (nom- 
indaj „morfosciencoj‘‘). Krome ili ofte emas 
kunigi la matematikon kun la natursciencoj 
kaj la filozofion kun la kultursciencoj. La 
statupropono (1983/1683 pfR - 09 - 26) por 
la Akademio Internacia de la Sciencoj San Ma- 
rino aplikas sciencteorie pli kontentigan klas- 
igon por strukturigi la Akademion en ses sek- 
ciojn je po 3-4 fakaroj (vd. grkg/Humankyber- 
netik 3/83, p.151-152). Gi estas skizita per la 
sekva kvara apendico de tiu nia propono. 


La angla kaj franca vorto „science”” inkluzivas 
nur la sciencojn kiuj enkondukas kalkulojn 
kaj celas prognozojn (t.n. „nomotetaj' ” aŭ 
„parametraj” aŭ prospektivaj” sciencoj de la 
sekcioj 1, 3 kaj 5). La internacilingva ter- 
mino „scienco”” (same kiel la germana termino 
doj kg inkluzivas krome ankaŭ la t. 
n. „ideografajn” aŭ „neparametrajn ”sciencojn 
(sekcioj 2, 4 kaj 6), kiuj apenau uzas mate- 
matikan modeligon, sed strebas al kompreno 
de la fenomenoj ankaŭ surbaze de regantaj 
valoroj. - AIS flegas ĝis la limoj de esperebla 
intersubjekteco ambaŭ alojn de la tuta scien- 
caro. La aldonita bildo reprezentas la struktu- 
rigon de AIS en sekciojn kaj iliajn najbarec- 
ojn. La unnopaj sekcioj estas provizore 
subdividitaj en fakarojn laŭ la sekva klasigo. 


1. Kibemetiko (pritraktanta mezurante kaj 

modeligante informon) 

1.1 Antropokibernetiko (psikokibernetiko, lin- 
gvokibernetiko, kibernetika estetiko, so- 
ci- kaj ekonomikibernetiko, klerigkiber- 

_ netiko, jurkibernetiko). 

1.2 Generala kibernetiko (teorio de informacio 
kaj enkodigo, teorio de logikaj Saltretoj 
kaj abstraktaj aŭtomatoj, generala regu- 
ladteorio, teorio de adaptiĝaj kaj cel- 
orientitaj sistemoj, informadiko). 

1.3 Maŝinkibernetiko (teknologioj de telekom- 
unikado, de informstorado, de reguligo, 
de komputiloj, kaj de la aŭtomacio). 

1.4 Biokibernetiko (inkluzivante la kibernetikan 
medicinon). 


2. Kultursciencoj (pritraktantaj informecajn 
fenomenojn apenaŭ aplikante mezuradon 
kaj matematikan modeligon) 


2.1 Bazaj nekibernetikaj antroposciencoj (nepa- 
rametraj psikologio, etnologio, lingviko, 
kaj sociologio). 

2.2 Socisciencoj nekibernetikaj (administraci- 
scienco, ekonomiko, jurscienco, politolo- 
gio, neparametra klerigscienco, nekiber- 
netika komunikad- kaj dokumentadsci- 
enco). 

2.3 Artsciencoj neparametraj (muzikologio kun 
muzikhistoriko, estetiko kaj historiko de 
la porvidaj artoj, beletriko, estetiko kaj 
historiko de la scenejaj artoj). 

2.4 Integraj kultursciencoj (kompara religi- 
scienco kun religihistoriko, socigeogra- 
fio, ĝenerala historiko). 


3. Struktursciencoj (analizantaj kaj formale 
modeligantaj la mekanismojn de la aprioraj 
ekkonoj) 










Kibernetiko Kultursciencoj 
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Morfosciencoj 





Natursciencoj 





3.1 Pensadstruktursciencoj (simbola logiko, te- 
orio de algoritmoj, ĝenerala aksiomatiko, 
aritmetiko kaj nombroteorio, probablo- 
kalkulo kaj matematika statistiko). 

3.2 Imagadstruktursciencoj (geometrio, kine- 
matiko, ĝenerala stistemiko). 

3.3 Formalaj matematikaj sciencoj (algebro, 
teorioj de serioj, funkcioj, ekvacioj, dis- 
tribucioj ktp., kalkuloj de vektoroj, ma- 
tricoj, diferencialoj, integraloj ktp.). 


4. Filozofio (celante unuflanke plej bazan, ali- 
flanke kunigante-kompletigan komprenon 
de la esto, iĝo kaj ekkono) 

4.1 Filozofiaj bazosciencoj (filozofia logiko, 

epistemologio) 

4.2 Filozofiaj valorteorioj (filozofia estetiko, 

moralfilozofio, jurfilozofio, statfilozo- 


fio). 

4.3 Model- kaj sciencteorioj (ĝenerala model- 
teorio, ĝenerala sciencteorio, filozofioj 
de la unuopaj sciencoj). 

4.4 Idehistoriko (historiko de la filozofio, his- 
torikoj de la unuopaj sciencoj). 


5. Natursciencoj (pritraktantaj mezurante kaj 
modeligante materion kaj energion) 


5.1 Substancikoj, tee. ĝeneralaj sciencoj pri la 
koncernaj, loke kaj tempe invariantaj 
leĝoj (fiziko kun siaj teknologioj: kon- 
strustatiko, masinteknologio, elektro- 
teknologio ktp.; kemio kun siaj tekno- 
logioj). 

5.2 Mondikoj, t.e. geo-kaj astrosciencoj (astrono-- 
mio, geodezio, naturgeografio, geologio). 

5.3 Biosciencoj (ĝenerala biologio, botaniko, 
zoologio, medicino, agronomio, nutrad- 
scienco, ekologio). 


6. Morfosciencoj (celantaj pli intuicie ol mate- 
matike ĉerpi informon el la observita mater- 
ieca-energieca mondo kaj formi ĝin konfor- 
me al ideoj) 

6.1 Sciencoj pri aŭdvida dokumentado (sciencaj 
fotado, filmado, sonsurbendigo ktp.; 
museologio). 

6.2 Ilarmorfologio (ergonomiko, formado de 
industriaj produktoj). 

6.3 Mediplanado (arkitekturo, ĝardenformado, 
urbo- kaj regioplanado, trafikplanado, 
turismiko). 
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Probleme der semantischen Analyse 
bei der automatischen Faktenrecherche 


von Georg F. MEIER, Berlin (DDR) 


Sieht man von rein graphischen Informationen (Diagrammen, Tabellen u.ä.) ab, so gilt, 
daß jede Information mittels sprachlicher Einheiten erfolgt. Im allgemeinen handelt es 
sich um mehr oder minder umfangreiche textuelle Äußerungen, die gegebenenfalls in 
kleinere inhaltstragende Einheiten zerlegt werden können: Text — Absatz — komplexer 
Satz — einfacher Satz bzw. Teilsatz (Gliedsatz) — Satzglied — Syntagma — Wort — (sel- 
ten) Wortteil (d.i. Monem, Radikal, Stamm, Wurzel usw.). Die Zergliederung (parsing) 
ist in vielen Sprachen formal durch Absatz. Interpunktion, Großschreibung (im Deut- 
schen), Satzgliedpartikel (z.B. ga und wa im Japanischen), Artikel (in einigen euro- 
päischen Sprachen, im Arabischen, Ungarischen) vorbereitet. Auch wenn Interpunkts- 
regeln keineswegs “logisch” sind, so sind sie doch festgelegt und programmierbar. 
Selbst die Wörter (Lexeme) und Moneme (Morpheme) können mehr oder minder voll- 


- ständig im Permanentspeicher (Lexikon) eines Rechners erfaßt und damit abrufbar 


gemacht werden. Die Reihenfolge der Lexeme innerhalb einer Texteinheit kann abge- 
zählt werden und mit eingespeicherten Distributionsregeln verglichen werden. Es kann 
somit eine formale Syntax erkannt werden, die ihrerseits je nach Sprachsystem be- 
stimmte grobe Aussagen über die inhaltliche Struktur zuläßt. All diese Operationen 
sind heute für einige Sprachen — sieht man von einigen Problemen ab — prinzipiell 
gelöst, sofern die entsprechende Kleinarbeit (vollständiges Lexikon, vollständiges 
grammatisches Regelsystem, evtl. Transliteration usw.) vorliegt. Trotzdem ist weder 
eine automatische Übersetzung von hoher Qualität noch eine Speicherung von Sach- 
verhalten bisher gelungen, obwohl besonders für die Übersetzung eine Reihe von Zu- 
ordnungsoperationen, teilweise ganzer Phrasen, gefunden wurden, so daß eine eigent- 
liche Inhaltserkennung ausgespart werden kann. Bei einer Mehrfach-Sprachübersetzung, 
d.h. bei sogenannten multilateralen Verfahren ist eine “Zwischensprache” (Meta- 
sprache, prädikatenlogische Sprache, Interlingua, Informationslogisches System) erfor- 
derlich, da dieses Verfahren im Prinzip reversibel funktionieren muß. Begriffskataloge, 
wie numerische und nicht-numerische Klassifikationssysteme, Facettensysteme, 
Thesauren unterschiedlicher Präzision, Informationsrecherchesprachen, wie SYNTOL 
oder der Univerzal'nyj semantiĉeskij kod V. Martynovs, Noematika u.a. sind sicher 
eine wichtige Hilfe für die Umkodierung sprachlicher Lexeme auf ihre Sememe und 
Bedeutungselemente, aber sie stellen noch keine Basis für eine Sachverhaltsdarstellung 
her. Versuche auf Grund der Häufigkeit der jeweiligen Umgebung gewisse Kerninhalte 
zu erfassen, setzen entsprechende statistische Untersuchungen und Distributionsklas- 
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sen voraus, die nur auf der Basis bereits bekannter Informationen geschaffen wurden, 
aber eine Neuinformation unwahrscheinlich erscheinen lassen. Frage-Antwort-Systeme, 
die im Bereich komplexen Wissens wirksam werden sollen, d.h. über den Bereich be- 
schränkter Auskunftstexte hinausgehen, müssen exakte Inhaltsspeicherungen besitzen, 
die nicht mit den realen Sätzen natürlicher Sprachen identisch sind. Für Dokumenten- 
recherchen mögen Deskriptoren bzw. Schlüsselwortverfahren genügen, obwohl auch 
hier erst durch entsprechende Umgebungselemente die Relevanz des Nachweises erfaßt 
werden kann. Gedankliche Zusammenhänge, Werturteile, Entscheidungsgrundlagen, 
Sachverhaltsabfragen und Wissenskombinationen sind nur möglich, wenn das Er- 
schließen des Inhalts eines in einer natürlichen Sprache vorliegenden Textes möglich 
sein wird. Spätestens um 1970 wurde international die Unlösbarkeit von Informations- 
speicherung auf asemantischer Basis erkannt Damit setzte sich die von verschiedenen 
Seiten schon in den 60er Jahren geforderte Konzentration auf die semantische Analyse 
als wichtige Voraussetzung für diesen Zweig der linguistischen Datenverarbeitung im- 
mer mehr durch (vgl. Meier, 1966). Zwanzig Jahre später kann man erst von Anfangs- 
ergebnissen sprechen, von einer Vielzahl von Methoden, teils nur auf Minimaldistink- 
tion bedacht (Antonymverfahren), teils mehr psychologisch fundiert (skalare Metho- 
den), teils nur innersprachlich angelegt (sog. “Sem”-Analysen), teils intersprachlich 
aufgebaut (noematische Methoden), teils mehr auf Satzanalysen unter Verzicht auf 
Sememdefinitionen, teils nur auf Methoden der Formalisierung ausgerichtet. Die mei- 
sten Verfahren — soweit sie nicht nur zur Stützung einer Grammatik- oder Semantik- 
Hypothese dienen sollten — weisen einen hinreichenden Grad adäquater Methodologie 
und Selbständigkeit auf. Es ist weder im Rahmen dieses Aufsatzes noch beim gegen- 
wärtigen Entwicklungsstand überhaupt ratsam, eine Zusammenschau aller semantischen 
Verfahren vorzunehmen. Es geht uns hier vielmehr darum, Probleme zu zeigen und auf 
Lösungsmöglichkeiten aus dem eigenen Erfahrungsbereich zu verweisen. 

Wir gehen von zwei allseitig bekannten Fakten aus: 1) alle Menschen können die in 
ihrer Muttersprache oder einer relativ gut erlernten Sprache geäußerten Gedanken 
(Sachverhalte, Fragen usw.) verstehen, sind also zur semantischen Analyse der Äuße- 
rungen fähig; 2) alle Lexikographen, ebenso die Verfasser einsprachiger wie zwei- oder 
mehrsprachiger Wörterbücher, mußten und konnten intuitiv die Bedeutung(en) der 
erfaßten Wörter analysieren. In beiden Fällen wirkten und wirken die kontextuellen 
Elemente mit, sei es um die jeweilige aktuelle Bedeutung zu erkennen oder sei es aus 
den Kontexten eines Wortes seine potentiellen Bedeutungen zu notieren. Der sehr 
komplizierte Mechanismus unserer Gehirnarbeit ist trotz verschiedener blackbox- 
Experimente noch kaum erschlossen, so daß ein bionisches Modell Hypothese bleibt. 
Da die Sprache als Ergebnis vieler teils sehr weit zurückliegender Perioden ihres histo- 
tischen Werdeganges aus allen Perioden Residuen und Neuerungen in sich birgt, ist sie 
mit Mitteln der Logik nicht beschreibbar. Je mehr Sprachen zu einem lexiko-seman- 
tischen Vergleich herangezogen werden, desto deutlicher läßt sich der große Unter- 
schied in der jeweiligen Bedeutungszuordnung erkennen. Dasselbe gilt für die formale 
und semantische Seite der Grammatik. Es gibt nahezu keine Universalien in der Syntax, 
Morphologie, bei Wortarten oder grammatischen Kategorien. Die semantische Analyse 
von Sätzen fällt von Sprache zu Sprache ganz anders aus. So kann man nicht von einer 
scheinbar logischen oder ontologischen Kategorie auf die einer anderen Sprache 
schließen. Ebenso ist es unmöglich ein Wort in der Sprache L, eineindeutig auf ein 
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Wort in der Sprache L, abzubilden. Das hat nicht nur zur Folge, daß vor einer Abbil- 
dung eines Lexems auf ein anderes die Polysemie ausgelöscht wird, d.h. daß durch Auf- 
finden der richtigen aktuellen Bedeutungen aus der Zahl der möglichen Bedeutungen 
eines Wortes oder einer Wortgruppe (Syntagma) das jeweilige abbildbare Semem festge- 
legt werden muß, sondern daß durch exakte Definition der jeweiligen Bedeutung 
(Semem) auch die Bedeutungsbreite zum Vergleich bereitgestellt werden muß. 

Wenden wir uns zunächst dem letztgenannten Problem anhand einiger einfacher 
Bedeutungsfelder (Bedeutungsklassen) zu: Für genealogische oder historische Informa- 
tionen spielen die Verwandtschaftsbeziehungen eine nicht unwichtige Rolle. Auch für 
juristische Fragen (Erbschaftsfragen usw.) kann eine genaue Bestimmung wichtig sein. 
Relativ universal sind — soweit patriarchalische Verhältnisse bestehen — die Sememe 
“Vater” und ‘Mutter’ (rein genealogisch) unter Ausschluß von Stiefverwandtschaften 
und Adoptiv-Verwandtschaften. Aber es gibt Sprachen, die Unterschiede für den eige- 
nen Vater und für den fremden Vater machen oder — wie im Tibetischen — mit pha 
den ‘gewöhnlichen Vater’ und mit jab den “Vater einer Respektsperson’ bezeichnen. 
Schon bei den Kindern ist die Differenzierung unterschiedlich: so ist im Georgischen 
sbili “Kind” und ‘Sohn’, während die ‘Tochter’ als kalisVili bezeichnet wird (Frau-Toch- 
ter), ähnlich span. hijo (Sohn)/hija (Tochter), aber hijos (Kinder und Söhne). Noch 
komplizierter wird die Abbildung bei Geschwistern. So sind im Ungarischen älterer 
Bruder (bätya) und jüngerer Bruder (öcz) und früher auch bei den Schwestern nene 
und hug unterschieden worden, bei den Mongolen aha (älterer Bruder) und düü (jün- 
gerer Bruder), ähnlich im Vietnamesischen u.a. Sprachen. Im Baskischen und Svani- 
schen (im Kaukasus) muß zwischen dem Bruder des Bruders (anai) und dem Bruder 
der Schwester (neba) unterschieden werden, d.h. eine Schwester nennt ihren Bruder 
anders als der Bruder seinen Bruder nennt. Desgleichen nennt die Schwester ihre Schwe- 
ster ahizpa, während der Bruder sie arreba nennt. Svanisch analog nennt die Schwester 
ihre Schwester udil und ihren Bruder gemil, der Bruder seine Schwester daĉwir und 
seinen Bruder muxwbe. Während Deutsche, Engländer, Franzosen, Italiener nur 
zwischen ‘Onkel’ und ‘Tante’ bzw. uncle/aunt bzw. oncle/tante bzw. zio/zia unter- 
scheiden, differenziert das Schwedische zwischen farbror (Vaterbruder) und morbror 
(Mutterbruder) für den “Onkel” und analog faster bzw. moster für die “Tante”. Diese 
Unterscheidung treffen auch die Araber amm (Vaterbruder)/ amma (Vaterschwester) 
bzw. xal (Mutterbruder)/xala (Mutterschwester) oder — sicher teils durch offenbaren 
Einfluß des Arabischen, teils original — im Aserbajdschanischen ämi (Vaterbruder)/ 
bibi (Vaterschwester) bzw. dady (Mutterbruder)/xala (Mutterschwester). Das Serbo- 
kroatische unterscheidet auch zwischen Vaterbruder (stric) und Mutterbruder (ujak), 
aber auch dem Mann der Vaterschwester oder Mutterschwester (tetak). Im älteren 
Slowakischen hat man u.a für die Frau des Mutterbruders ujĉina und des Vaterbruders 
strynĝ. Andere Sprachen unterscheiden zwischen den verschiedenen verschwägerten 
Verwandten, so bulgarisch Surej (Schwager des Ehemanns), dever (Schwager der Ehe- 
frau), zalva (Schwägerin der Ehefrau), baldäza (Schwägerin des Mannes). Im Vietna- 
mesischen wird u.a. noch zwischen dem älteren Brudes des Mannes (anh chöng), dem 
älteren Bruder der Ehefrau (anh vo), dem Mann der älteren Schwester (anh rĉ), zwi- 
schen jüngerer und älterer Cousine, zwischen jüngstem Bruder und jüngerem Bruder 
usw. unterschieden. Die Beispiele mögen genügen, um zu zeigen, daß familienrechtliche 
oder kultusbezogene Gründe die eine oder andere Differenzierung erforderlich mach- 
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ten. Bei einer einspeicherbaren Verwandtschaftseinheit genügen also nicht Sexus, 
Generation, Blutsverwandtschaft, Sonst entstehen — wie das Beispiel ‘Schwager’ oder 
‘Onkel’ zeigt — immer Schwierigkeiten, wenn man von der weniger differenzierenden 
in die enger differenzierende Sprache übersetzt, da hier Informationsmangel vorliegt. 

Handelt es sich hier um unverkennbare gesellschaftliche Gründe, so ist dies z.B. 
bei der Bezeichnung von Farben sicher nicht der Fall. Lassen sich Verwandtschafts- 
grade relativ leicht als prädikatenlogische Kalküle formalisieren, z.B. sohn = R,a: 
(a,b) + be mask, so macht der ideelle Charakter der Farbempfindung besondere Schwie- 
rigkeiten, selbst wenn man bei Elementar-Farben die physikalischen Daten nennen 
könnte (also Reflexionskoeffizient, Wellenlänge und spektrale Farbdichte). Selbst 
wenn wir nur 10 000 Farben unterscheiden könnten — es gibt viel höhere Schätzungen 
(Kries und Judd setzten mindestens 300 000 an), so stehen dem höchstens 200 bis 
250 Farbbezeichnungen, viele mit Vergleichselementen, wie fuchsrot, smaragdgrün 
usw. gegenüber. Schlimmer aber ist es, wenn — wie in der Munda-Sprache — nur drei 
Farbwörter vorhanden sind oder die Farbbezeichnungen von Sprache zu Sprache sich 
nicht decken, wie z.B. bei chinesisch ging, das die Skala grasgrün, teegrün, olivgrün, 
bleifarben, grau, blau bis schwärzlich umfaßt oder wenn dem tschuwaschischen kavak 
‚(aus altturksprachlich kok) im Russischen seryj, sizyj, goluboj, sinij, sedoj, sivyj und 
serovatyj entsprechen, d.h. daß die Farbe kavak die Breite von tiefgrau, bleigrau, 
hellblau, tiefblau, schimmelgrau, silbergrau, grauweiß bestreitet. Der Computer kann 
hier nicht strenge Grenzen ziehen, zumal — wie im Chinesischen und anderen Sprachen 
Synonyme existieren, die jedoch nur in bestimmten Syntagmen verwendet werden kön- 
nen, so wird bei ‘grün’ für Wald das Wort li verwendet, das auch für Bohnen und schwar- 
ze Haare benutzt werden muß. Eine Basis kann der Dictionary of Color (erstmalig 1930 
mit 4000 Farbenbezeichnungen erschienen) bilden, doch müssen für die Synthese z.B. 
ins Chinesische oder Japanische die entsprechenden Umgebungen programmiert sein. 

Besondere Unterschiede in der Bedeutungsbreite bzw. im syntagmatischen Anwen- 
dungsbereich weisen auch viele Verben bzw. Prozeßbezeichnungswörter auf. So hat das 
deutsche Verbum abnehmen rund 40 verschiedene Übersetzungsentsprechungen im 
Italienischen, während die entsprechenden italienischen Verben keineswegs im Deut- 
schen nur durch abnehmen zu übersetzen sind (vgl. G.F. Meier, 1978, pp.143-150). 
Das trifft nun für nahezu alle anderen Sprachen in ähnlicher Weise zu, z.B. um 35 ver- 
schiedene Übersetzungsäquivalente im Russischen, wobei z.B. das deutsche abnehmen 
von Hut, Mantel, Ring im Russischen durch snjat’ wiedergegeben wird, das seinerseits 
auch für das ausziehen bei Schuhen oder anderen Kleidungsstücken verwendet wird 
oder für photographieren, wofür wir höchstens aufnehmen (nicht abnehmen) sagen 
können. Um 35 verschiedene deutsche Verben müssen für smjat' verwendet werden, 
so abbrechen (von Brücken), entfernen, abputzen, aufnehmen, belegen, mieten, abhe- 
ben, verhören, streichen, zurücknehmen, absetzen u.a. In der gleichen Größenordnung 
verhält sich Deutsch zu anderen slavischen Sprachen. Für die Analyse muß also schon 
ein Abfrage-Algorithmus vorbereitet sein, der zunächst nach intransitiver Verwendung 
(Fehlen des Objekts) und dann nach der Bedeutung des Subjekts, also z.B. Mond, 
Mensch, Fieber, Kraft, Vorräte... fragt und im Falle der Besetzung der Objektsstelle 
nach der Bedeutung des Objekts fragt, also Eid, Parade, Koffer, Verantwortung, Last, 
Wäsche, Telephonhörer usw. Dabei muß der Algorithmus soviele Fragen stellen, wie es 
sich aus der Summe aller beteiligten Sprachen ergibt. 
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Ein weiteres Problem stellen die festen Syntagmen dar oder zunächst noch die Fest- 
stellung welcher Teil eines Satzes ein im Lexikon eingetragener Bedeutungsträger ist. 
Dabei müssen wir zwischen Komposita und Komplexwörtern unterscheiden. Im Deut- 
schen oder Ungarischen werden Nominalkomposita zusammengeschrieben, so daß sie 
als ein Lexem leicht erkennbar sind. Aber in anderen europäischen und asiatischen 
Sprachen muß erst das Formativ, d.h. der eigentliche Bedeutungsträger erkannt werden. 
Hier einige Beispiele: 

deutsch Bildkristallgleichrichter 

enlglisch: crystal video rectifier (drei Elemente) 

russisch: kristalliĉeskij videodetektor (zwei Elemente) 

französisch: redesseur a cristal video (vier Elemente) 

italienisch: radrizzatore video a cristallo (vier Elemente) 

spanisch: rectificador de cristal de video (fünf Elemente) 

japanisch: ji shin ko tei kio ku soo chi (= permanenter Magnetkernspeicher) 

(acht Elemente) 
vietnames.: mäy dao döng cö tia dien (= Elektronenstrahl-Oszillograph) 
(sechs Elemente) 


Die Lösung bestünde in der prinzipiellen Suche nach dem längsten im Lexikon einge- 
tragenen Syntagma, was aber bei morphologiearmen Sprachen zu Verwechslungen 
zwischen festen und nicht festen Wortverbindungen führen kann. Außerdem muß das 
rasche Anwachsen des technischen Fachwortschatzes zu ständigen Korrekturen des 
Lexikons führen. 

Das andere Problem stellen Komplexwörter aus verschiedenen Wortarten, besonders 
sogenannte Streckformen dar. Im Deutschen, aber auch in anderen europäischen 
Sprachen nehmen diese Formen immer mehr zu, wie etwa zu Gehör bringen, zur 
Kenntnis nehmen, zu überlegen geben, Maßnahmen treffen usw. Aber auch Komplex- 
Präpositionen wie in Zusammenhang mit, oberhalb von, unter der Bedingung daß, unter 
Ausschluß von, zusammen mit, franz. au lieu de, engl. because of usw. In manchen 
Sprachen stellen solche Komplexwörter einen hohen Prozentsatz des Wortschatzes dar, 
so in den Turksprachen, z.B. aserbajdschanisch müsahidä etmäk (Beobachtung machen), 
basa düsmäk (wörtl. in den Kopf fallen — verstehen); in iranischen Sprachen, z.B. per- 
sich tahsil kardan (Studium machen); in indoarischen Sprachen, z.B. hindi kheti karna 
(Landarbeit machen), nepali daga dinu (Betrug geben = betrügen); japanisch benkyö 
suru (Studium machen), vietnamesisch v& nha (zurückgehen Haus = heimkehren), di 
chän (gehen Fuß = zu Fuß gehen); chinesisch kaidöng (in Bewegung setzen), danxin 
(tragen-Gedanken = sich sorgen). Hier greifen Syntax- und Lexikanalyse eng inein- 
ander über, da — besonders beim Deutschen — die Teile im Satz getrennt werden kön- 
nen. Auch diese Komplexwörter müssen im Lexikon mit Verweis auf eventuelle syn- 
taktische Suchregeln eingetragen sein. Das gilt auch für Korrelativa, wie italienisch 
tanto... quanto, deutschje... desto... usw. 

Das Hauptproblem stellen aber nach wie vor die lexische und grammatische Poly- 
semie dar. Wir erwähnten oben die Nichtübereinstimmung zwischen den Bedeutungen 
in verschiedenen Sprachen. Das geht natürlich teilweise auf die Polysemie zurück. An- 
dererseits gibt es auch innerhalb einer Sprache die Polysemie, die der Muttersprachler 
fast automatisch monosemiert, während der Computer eine immense Arbeit ausfüh- 
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ren muß, da er zunächst im Lexikon alle möglichen Sememe vorfindet und nun mit 
Hilfe einiger syntaktischer und speziell lexiko-semantischer Abbfragen die Monosemie- 
rungsoperation ausführen muß. Wir wollen an einem relativ einfachen Fall den Mono- 
semierungsprozeß vorführen, wobei einige Vereinfachungen vorgenommen worden 
sind. Die Prüffragen richten sich nach Satzgliedfragen und Kasus, die zuerst ermittelt 
werden müssen, um dann die lexischen Besetzungen der Leerstellen ermitteln zu kön- 
nen. Der Satz Die ersten Spieler nehmen ihren Platz ein enthält das Verb einnehmen, 
das polysem ist, Um es zu monosemieren muß es eine algorithmisierte Operation 
durchlaufen, die für alle Sememe von einnehmen gültig ist. Vorher muß die syntaktische 
und grammatisch-semantische Analyse erfolgen. Spieler kann Singular oder Plural, 
Nominativ oder Genitiv-Plural, Dativ-Singular und Akkusativ sein, ebenso ist ersten 
polysem, sogar die. Die Satzanalyse erfolgt auf der Basis der Satzgliedanalyse, hier also 
zunächst Nominalgruppe-Verbum-Nominalgruppe-Präfix. Doch auch dies muß erst fest- 
festellt werden. Im Lexikon sind alle möglichen Wortformen eingetragen, also auch 
ersten, ihren, nehmen... ein. Zugleich ist die Wortklasse beigefügt, so daß das Verbum 
als solches sofort festgelegt ist, ebenso Nominalgruppen. 

Wir zeigen hier vereinfacht die syntaktische Entscheidungsoperation, wobei ein 
Minus in der Spalte die gesamte Spalte annulliert. Treffen zwei positive Spaltenwerte 
bei nur einer möglichen Lösung zu, so ist ein weiterer Durchgang erforderlich. (Bild 1) 
Das Ergebnis ist eine klare Satzanalyse, so daß nun nach einem Subjektsnominativ oder 
Objektsakkusativ (O,) hinsichtlich der lexischen Besetzung gefragt werden kann. 

In Bild 2 wird der Algorithmus der Monosemierung gezeigt. Es gibt hier aber Fälle, 
in denen innerhalb eines Satzes noch keine Monosemierung durchgeführt werden kann. 
Das betrifft die Frage nach Kontext ‘militärische Gewalt’. 

Die Entscheidung zwischen dem Semem 4 und 5 ist in dem Satz Die vier Panzer 
nehmen den Schulhof ein ohne weiteren Kontext nicht möglich, da sie im Zuge einer 
Kampfhandlung oder zur Unterstellung bei einem Manöver in den Schulhof gefahren 
sind. Im letztgenannten Falle heißt einnehmen, daß nur vier Panzer in den Hof passen. 
Man würde hier gewöhnlich noch das Adjektiv ganz einfügen. Wir haben die Kontext- 
frage deshalb auf ‘militärische Gewalt’ gegen früher Militärbegriff’ erweitert, da dieser 
schon durch ‘Panzer’ gegeben wäre. Allerdings bedeutet ein solcher Kontextverweis oft 
eine umfangreiche Liste von Schlüsselwörtern oder Wortgruppen, wie etwa “nach 
langem Kampf” usw. Glücklicherweise sind solche polysemen Sätze schon theoretisch 
selten, kommen praktisch noch seltener vor. 

Grammatik heißt nicht nur Regelsystem formaler Art, sondern vielfach auch seman- 
tische Aussage. Dies gilt für alle grammatischen Kategorien, die nicht nur zur Herstel- 
lung von Kongruenzen dienen. Ob es sich um Einzahl oder Mehrzahl von Dingen oder 
Personen handelt, kann die Maschine nur an sprachlichen Mitteln erkennen. Da die 
Analyse beim Prädikativ, d.h. meist beim Prädikatsverb beginnt, müßte aus der Verb- 
form die Numeruskategorie und aus ihr die reale Zahl ersichtlich sein. Dies trifft nun 
aber in vielen Sprachen nicht zu. Es gibt Sprachen ohne Pluralkategorie, wie Chine- 
sisch, Japanisch, Vietnamesisch u.a., wenn man von den Pluralbildungen bei den Per- 
sonalpronomina absieht; es gibt Sprachen, die am Verb keine Numeruskategorie aus- 
drücken oder in der 3. Person keinen formalen Unterschied aufweisen (z.B. Litauisch); 
es gibt Sprachen, die im Prädikat die an sich mögliche Pluralform nur verwenden, wenn 
das Subjekt Menschen sind, z.B. aserbajdschanisch mäktäbin häjätindä uŝaqlar ojnajyr- 
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| 2 
Kontext: 
militärische erobern 
3 Gewalt 


8 


1) Der Mann nimmt das Medikament ein 

2) Der Schüler nimmt seinen Platz ein 

3) Der Eisverkäufer hat 100,- Mark eingenommen 

4) Die Armee nimmt die Stadt ein 

5) Die Regale nehmen das ganze Zimmer ein 

6) Wir nehmen den neuen Kollegen für unseren Plan ein 
7) Sie ist völlig für den Friedenskampf eingenommen 
8) Der Vorsitzende ist stark von sich eingenommen 

9) Sie ist von diesem Sänger völlig eingenommen 

10) Er nimmt die Stelle des Vorsitzenden ein 


Fan sein 


[neme ] 


Bild 2 
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dyrlar (wörtl. Schule-Gen. auf-Hof-ihren Kind-pl. spiel-imperf.-pl.), aber bulutlar goj 
üzünü Ortmiisdii (wörtl. Wolke-pl. Himmel an-ihn bedecken-prät.-sg.). Ähnliches finden 
wir im Georgischen, in iranischen Sprachen, auch in Bantusprachen. Desgleichen ste- 
hen in vielen Sprachen nach den Numeralia entweder Singular oder bestimmte Zähl- 
wörter, so türkisch bes ev (5 Haus), georgisch xuti saxli (5 Haus), baskisch bortz etxe 
(5 Haus), ähnlich ungarisch usw. In anderen Sprachen, wie z.B. den slavischen steht 
nach 2-4 der Genitiv Singular, ab 5 Genitiv Plural; im Arabischen steht 3-10 mit Sub- 
stantiv im Genitiv Plural und das Zahlwort im entgegengesetzten Genus, also thaläthat 
(fem.) fellahin (m.Gen. Pl.). Im Chinesischen, Burmesischen, Japanischen usw. muß 
der Plural bei allgemeiner Zahl aus dem Kontext erschlossen werden, während er bei 
konkreten Zahlen mit einem Zählwort ausgedrückt wird, das je nach Bedeutungsklasse 
zugeordnet werden muß, so burmesisch -ü für Personen, gäu für Tiere, khu für Wörter, 
ŝu für Pagoden usw. Bei Ergativsprachen muß das Objekt aus dem Nominativ erschlos- 
sen werden, während das Agens im Ergativkasus steht, doch kann dies bei einem Teil 
der Ergativsprachen noch vom Tempus abhängen. In vielen Sprachen werden Subjekt 
und beide Objekte in den Verbalkörper inkorporiert, z.B. baskisch guk saldu geniezaz- 
kinakeen Wörtl. wir-ergativ verkaufen wir-Dat.-haben-pl.dir.Obj.-ihr-fem.sg.-kann- 
Prät. = wir hätten sie (pl.) an sie (f.) verkaufen können). Besonders schwierig sind auch. 
die Verben grammatisch-semantisch zu analysieren, da sie oft sehr polysem sind. So 
drückt das deutsche Präsens die Gegenwart, die Außerzeitlichkeit, die Gewohnheit, 
die Gesetzlichkeit, das reale Futur, historisches Erlebnis, Aufforderung, reale Bedin- 
gung u.a. aus. Lexische und grammatische Bedeutung gehen oft Hand in Hand, z.B. bei 
transitiven Verben (Valenz), bei Aspektsystemen oder Aktionsarten, beim Ausdruck 
der verschiedenen Modalitäten. Lexeme können zugleich auch als Grammeme fungie- 
ren, z.B. das französische Immediat-Präteritum je viens de manger (ich habe soeben 
gegessen), wo venir nicht mehr die Bedeutung ‘kommen’ hat, die es sonst ausdrückt. 
Bei Verben der Emotion steht in den kaukasischen Sprachen das Subjekt im Objekts- 
kasus, im Finnischen das Objekt im sogenannten Partitiv: rakastan Teitä (ich liebe Sie, 
eigentlich ich liebe einen Teil von Ihnen). 

Zur Inhaltserkennung gehört aber vor allem die richtige semantische Analyse aller 
Lexeme. Die Definition der Sememe kann nicht verbal eingegeben werden, sondern 
muß digitalisiert werden. Die Digitalisierung muß zugleich systematisch sein, d.h. daß 
die einzelnen Ziffern Information für Entscheidungsoperationen liefern. Dadurch ent- 
steht die Notwendigkeit einen sprachbezogenen Realienkatalog auszuarbeiten. Sprach- 
bezogen heißt hier, daß nur die in allen der zu verarbeitenden Sprachen befindlichen 
Sememe katalogisiert werden müssen. Die wichtigsten Noeme (intersprachliche Bedeu- 
tungsmerkmale, Begriffselemente) müssen an erster Stelle der Zahl stehen, d.h. daß sie 
in dem binär-hierarchisch aufgebauten System (Noematikon) die obersten Knoten be- 
setzen. Solche Hauptkategorien sind: Ding vs. Erscheinung, nur-Lebewesen/ nur Nicht- 
lebendes/ Vereinigung von Belebtem und Unbelebtem (Organisation, Institution); die 
Erscheinungen müssen wieder nach einstelligen und mehrstelligen Prädikaten und diese 
wieder nach Statik vs Dynamik unterteilt werden. Jedes Semem hat somit eine eigene 
Zahl, die es im System festlegt. So beginnen alle Lebewesen mit 1, alle Personen mit 
11, alle ethnischen Einheiten 111, alle Berufe mit 112, alle Nichtlebewesen (Dinge) 
mit 2, Kosmika mit 21, alle Institutionen mit 31, alle mehrstelligen Prädikate (Erschei- 


nungen) mit 4, wenn sie statisch sind, mit 5 wenn sie dynamisch sind, Energieübertra- 
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gung mit 51, Informationsübertragung mit 511, Informationsübertragung mit Effekt 
mit 5111 usw. Ŭber die Anwendung und den Aufbau des Noematikons werden wir in 
einem späteren Aufsatz berichten. 

Die “Definition” der Sememe muß vorher so vollständig als möglich erfolgen, d.h. 
es dürfen keine wesentlichen Elemente fehlen, da sie alle zur Monosemierung und zur 
Beantwortung im System des Mensch-Maschine-Dialogs erforderlich sind. Wir wollen 
das am deutschen Verbum widerlegen darstellen (s. Bild 3). Wir versuchten mit relativ 
wenigen Leerstellenkriterien auszukommen. Die hier verwendeten sind: S = Energie- 
sender, Y = Energieempfänger, Ri = Relation mit Definition im Index, C = Kommuni- 
kationsinhalt, E = Effekt, II = einstelliges Prädikat; andere Kriterien treffen hier 
nicht zu. 











Widerlegen, 


Nicht-Körper D Energieübertragung D Informationsübertragung D Effektive In- 
formationsübertragung > def. S (homo v collectiv v Produkt > graphisch) + 
+Y ((homo v collectiv} > Ryapions (Y, Sachverhalt 
v Hypoth.)) 
+C {Ilfalsch (Sachverhalt v Hypothese) + Ilargum. 
[R.ontra (Beweis, Sachverhalt v Hypothese)]} 
FE (Rag (Y,9). 


zu lesen: Info-Überträger S (Mensch v Gruppe v Buch) gibt an Info- 
Empfänger Y (Mensch v Gruppe), die einen Sachverhalt 
oder Hypothese kennen, eine Information C, beinhaltend 
falsch-Erklärung des Sachverh. v Hypoth. und Gegenargu- 
ment mit Beweis gegen Hypothese; mit dem Effekt, daß Y 
dem S die Beweisführung glaubt. 











Bild 3 


Der Prozeßablauf der semantischen Analyse erfolgt nun wie folgt: Zunächst wird der 
Text eingelesen, die Textwörter abgezählt (im allgemeinen die Lexeme bis zum Punkt), 
Zahlen und Symbole, die im Text verwendet werden, müssen vorläufig abgespeichert 
werden. Die Lexeme werden sofort dem permanenten Lexikon zugeordnet (Aufsuche- 
prozeß), nicht auffindbare Graphemketten (z.B. Eigennamen) werden zwischenge- 
speichert, aus der Interpunktion wird die Satzart ermittelt und Gliedsätze getrennt 
(mit Hilfe weiterer Regeln, wie Anzahl der Verben u.a.). Im Lexikon werden die poten- 
tiell festen Syntagmen ermittelt (Streckformen, Wortgruppen Spaltverben, Phraseolo- 
gismen usw.). Aufgrund des grammatischen Lexikoneintrags werden zunächst Wort- 
klasse (Wortart) und Satzgliedgruppen erfaßt und das Prädikativ (Prädikatsverb, Prädi- 
katsqualitativ) festgestellt. Aus dem Lexikon oder speziellen Valenzwörterbuch wird 
die Valenz des Prädikativs entnommen. Da noch keine Monosemierung stattfand, müs- 
sen zunächst alle Valenzen aller Sememe bereitgestellt werden. Aus dem Lexikon wer- 
den nun noch alle Grammeme und asemantischen grammatischen Funktionen, wie 
Kongruenzregeln, Genus, Klassen u.ä. entnommen, wobei die grammatische Katego- 
rie zunächst mit allen Grammemen (d.h. allen Bedeutungen einer grammatischen 
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Kategorie) bereitgestellt werden muß. Nach Distributionsregeln werden die Grammeme 
monosemiert und desgleichen werden nach Regeln der Monosemierung, die bei jedem 
Lexem (Lexemstamm) im Lexikon eingetragen sind, das aktuelle Semem ermittelt, 
soweit dies innerhalb eines Satzes möglich ist. Das aktuell zutreffende Grammembün- 
del wird zwischengespeichert. Hierauf erfolgt die Sememermittlung bei allen übrigen 
Lexemen des Satzes ebenfalls nach den Monosemierungsalgorithmen dieser Einheiten. 
Aufgrund des monosemierten Lexembestands wird die aktuelle Valenz festgestellt, 
insbesondere die des Prädikativs und als Leerstellenproposition dargestellt. Die Leer- 
stellen werden durch die monosemierten Aktanten als Argumente eingesetzt, so daß 
die Kernproposition gebildet ist, zu der Satzerweiterungsgruppen, Modalpartikeln, 
Satzeinleitungswörter und die Gliedsatzkomplexe — hinzugefügt werden. Jetzt können 
die zwischengespeicherten Teile und Grammeme abgerufen werden und die Proposi- 
tion kann gebildet werden. Alle Sememe werden in die Notation des Noematikons 
nach erfolgter Monosemierung transformiert. Die Operationsbefehle — mit 0 beginnen- 
de Zahlen — ordnen die Propositionen nach festen Ordnungsregeln so an, daß sie auf 
die entsprechenden permanent gespeicherten Relationen abgebildet werden können, 
so daß nur die Argumente die Neuinformation darstellen. Die Recherche-Frage muß 
so aufgebaut sein, daß sie dieselben Propositionen benutzt und das gefragte Argumen- 
tenbündel einer bestimmten Leerstelle durch das entsprechende Fragewort eruiert 
wird. Wir werden in einem folgenden Aufsatz diesen letztgenannten Mechanismus aus- 
führlicher darstellen, soweit das erarbeitete Modell dies schon zuläßt. Es haben sich 
dabei eine Menge von neuen Problemen ergeben, die auf bestimmte Mängel verwiesen 
haben, so z.B. die Auffindbarkeit von Nebeneigenschaften, die nicht für die Semem- 
definition wichtig waren, aber unter bestimmten praktischen Gesichtspunkten vorder- 


gründig werden können, so z.B. Wertangaben bei Produkten, zeitweilige Eigenschaft, 


wie Qualitätsminderungen, Absatzkriterien, Leitungskriterien, Wachstumskriterien 
u.ä. Die semantische Analyse ist zwar das A und O jeder Faktenrecherche, aber sie ist 


auch der schwierigste Forschungsgegenstand, ganz gleich ob man intralingual oder 


interlingual herangeht. Da Bedeutungen nicht streng abgezirkelte, logisch streng be- 
schreibbare Größen sind, sondern vielmehr immer offene Radikale nach Kontext- 
elementen zu sein scheinen, ja selbst in der Technik, so besonders in der Rechentech- 
nik, die Verwendung von Metaphern Überhand nimmt (die Maschinen erkennen, 
suchen, wissen, provozieren, verbergen, verstehen, korrigieren usw.), ist für jedes 
Neosemem auch ein entsprechender Kontext einzuspeichern. 
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Problemoj de la semantika analizo por la aŭtomata faktoj-reserĉado 
(Resumo) 


Komence ni diskutas kelkajn problemojn de lingvistika komputa datumprilaborilo, speciale por la 
fakt-reserĉo, kiuj baziĝas antaŭ ĉio sur la malperfekta prilaborilo de la semantaj faktoj. Pro tio ke 
“la lingvo ne estas de logika, sed de historia naturo, nur la lingvistika analizo estas eble. Unu de la 
plej grandaj malfacilaĵoj estas la polisemio de gramatiko kaj de leksiko, ĉar ili postulas multajn kom- 
plikitajn decidoperaciojn. Krome ekzistas granda diferencio inter la leksiko-sistemoj de diversaj 
lingvoj. Ni demonstras ĉi-tion per kelkaj ekzemploj, tiel la esprimoj de la parenceco kaj de la 
koloroj. Speciale polisemiaj estas la oftaj verboj, ekzemple oni devas traduki la germanan verbon 
„abnehmen” en la Italan per ĉirkaŭ 40 diversaj verboj; analoge en aliajn lingvojn. Alian malfacilecon 
ni trovas antaŭ ĉio en la teknika fakvorttresoro; ĉar multaj vortoj estas kombinitaj, sed ili ne estas 
skribataj entute. Tio-ĉi malfaciligas la identigadon de vortoj. Ankaŭ en la norma lingvo ekzistas 
multnombraj nepartigeblaj sintagmoj el verbo kaj substantivo. Tiam ni demonstras la mono- 
semigon de polisemiaj gramatikaj kaj leksikaj unuoj, tie-ĉi speciale la monosemigon de pluralaj 
finaĵoj en la Germana. La kategorioj de subjektivo kaj de objektivo ofte malfacile indentigas, tial ke 
ili estas enkompleksigataj en la formo de la verbo; antaŭ ĉio en la kazo de la ergativo-konstruado. 
Por stori la signifojn oni bezonas digitalajn unuojn, kiuj devas havi sisteman aranĝon. Tia sistemo 

„estas la „noematikon-o” de nia esplorado kies la aranĝo estas montrata. Per la ekzemplo de germana 
„widerlegen” (refuti) ni demonstras la metodon de difino de signifo. Fine ni klarigas la pro- 
cezo -iradon de la enhavo-analizo. 
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Mesure de la Durĉe du Present et du Moment Psychique Individuel 
en Termes de Vitesse d'Information 


De Juan Carlos CARENA Susana LESPINARD (traduction francaise) M. del R. SOL- 
HAUNE, J.L. FERRETTI, A. PARDAL, J. PLIEGO, R. ZETA, S. FERNANDEZ, 
L. TAMAGNO et M. RODRIGUEZ, Rosario (RA) 


de l’equipe de Pĉdagogie Cybernĉtique, Universite Nationale de Rosario, Argentine (Coordinateur: 
Prof. dr. Juan Carlos CARENA) 


I. Introduction 


Dans un dessin d’Instruction fonde sur la Pedagogie Cybernetique, on considere six 
«dimensions de l’espace ĉducationnel», ou «variables pedagogiques»: l'objectif didac- 
tique, la sociostructure, la psychostructure, le milieu informationnel, la matiĉre 4 
apprendre et la systematisation methodologique. 

D’apres H. Frank (1976), toute valeur que peut prendre chacune des variables peda- 
gogiques est susceptible d'ĉtre representee par un point dans un syst&me de coor- 
donnĉes dans un espace de six dimensions. Ainsi donc, tout enseignement possible 
est determine par six valeurs de coordonnĉes. 

Toute täche qui tend ä analyser lun des composants, aura une correspondance 
avec une valeur plus adequate de la variable dans le systĉme, et en consequence avec 
une plus grande validitĉ dans le sens d'un enseignement possible. 

Ce travail pretend faire des apports ä l'analyse de la Psychostructure, grace 3 l’etude 
de certaines caractĉristiques du sujet. C'est pour cela que nous avons fait une modifica- 
tion dans la premiĉre partie du test K.A.I. (Lehrl, 1980): Lecture de Lettres (BuL). 
Cette variante nait du besoin d’adapter cette partie-lä du test aux hispanophones. 

Des le debut, les applications faites en Argentine (zone Rosario), ont dĉmontrĉ que 
le temps de prononciation des lettres qui exigent l ĉmission de plusieurs sons (plus 
d'un) en langue espagnole (ex: «eme»-—«jota»--«ese»—), avait une influence sur le 
diagnostic de la capacite de l’afflux informatif 4 la conscience. Par consequent, on a 
ĉlaborĉ selon les criteres que P’auteur du test original propose, quatre nouvelles series 
de lettres. Elles ont ĉtĉ confectionnĉes en se servant seulement des quatorze lettres 
qui, en espagnol, sont prononcĉes d'une seule ĉmission de voix (Voir tableau 1). 

On a testĉ les sujets simultanĉment avec les sĉries des deux structures (de base et 
expĉrimentale), avec l'intention de comparer les temps de lecture. 

On a demontre, d'apres les statistiques, que notres series, adaptees a l’espagnol, 
permettent de mesurer l’afflux informatif la conscience d'une fagon plus exacte que 
les series eĉlaborĉes ä l’origine pour la langue allemande. Cependant, on d&montre aussi 
que cette structure entretient une &troite corrĉlation avec l’originale, ce qui permet de 
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la considĉrer comme une partie valable d'un nouveau K.A.I. adaptĉ 4 l’Hispanophone, 
sans perdre pour cela les objectifs de sa mesure. 








B. Structure Experimentale, avec des 
sons d’une seule &mission de voix, 
ĉlaborĉe par nous. 


A. Structure de Base pour la 
lecture de lettres, du test original. 
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Tableau 1 


2. Instruments 


Test Rapide d’Intelligence Generale (K.A.L). Dans la premiere partie (Lecture de 
Lettres: BuL), on a ajoute une structure experimentale de quatre nouvelles series 
(Voir Tableau 1). La deuxiĉme partie (Rĉtention de digits et de lettres) conserve sa 
structure originale. 


3. Sujets 


D’un &chantillon majeur, on a extrait au hasard 100 cas d’etudiants universitaries 
des deux sexes des Facultes d’Architecture et de Sciences Basiques de l’Universite 
Nationale de Rosario. Leurs äges oscillent entre 18 et 28 ans et leur participation dans 
les &preuves a ĉt€ volontaire. 


4. Resultats 


Puisque les resultats des mesures du BuL, dans les structures de Base (A) et Expĉri- 
mentale (B) s'approchent de la forme d'une courbe normale (Voir graphiques 1 et 2), 
on presente seulement la table des valeurs du BuL pour les deux structures. 


Table No. 1 


Resultats sur 100 sujets du temps moyen pour la lecture des lettres dans les deux 
structures. 


Structures 
De Base (A) 


Expĉrimentale (B) 





d=45 P x 01 (Refus de H,) 
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Ia temps en 


4 4.46 4.9 5.3 5.8 6.3 6.7 7.2 : secondes 





frequence 
28 |- 
26 
24 
22 


N 
oO 


Aa = i 
DRONDVMOVWRAO 


X = 5,52 
0 = 0.71 


Graphique No. 1: Distribution normale des rĉsultats du BuL forme A (de base) obtenus avec 
100 ĉtudiants universitaires des deux sexes entre 18 et 28 ans. 


frequence 
26 
24 
22 
20 
18 
16 
14 
12 
10 
8 
6 
a Be 
2 el temps en 
3.7 4.16 4.625.08 5.55 6.01 6.47 6.93 7.40 secondes 
x =5,27 
6 =0,73 


Graphique No. 2: Distribution normale des rĉsultats du BuL forme B (expĉrimentale) obtenus 


. avec 100 ĉtudiants universitaires des deux sexes entre 18 et 28 ans. 
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Le coefficient de correlation entre les €chantillons: 0,81, entre les deux structures A et 
B, permet d'assurer la validit& des series proposĉes pour mesurer le temps de l'afflux 
informatif 4 la conscience. 

Dans Vapplication du test parametrique — pour ĉtablir les differences entre les deux 
variables — on observe une valeur de Z = 4,5, c’est-ä-dire que on refuse la Ĥ,, , et on 
considere hautement significative, en indiquant que la structure experimentale deman- 
de moins de temps de lecture. 


Table No. 2 


Lecture des lettres (temps de chaque serie) 


Sujets Structure de Base (A) Structure Expĉrimentale (B) 


Sĉrie | Sĉrie | Sĉrie | Sĉrie BuL 1 2 3 4 BuL 
1 2 3 4 


S | 1.179 | 0.956 | 0.918 | 0.840 1.068 | 0.940 | 0.999 | 0.909 








F: 1 vs 3: 1.599 p>0,05 
2 vs 4: 1.360 p>0,05 
(1+3) vs (2+4): 16.490 p<0.001 
F Total: 6.478 p<0.001 F=5.05 p<0.01 


Les resultats de chaque serie, tant utilisant la structure de base que l’experimentale, 
ont montre une repetition relativement ĉlevĉe et homogene (coefficient de variation 
fluctuante entre 14,1% et 18,3%). Cela a motive des differences entre les temps moyens 
de r&ponse pour chaque serie: ces differences, (quoiqu'elles soient petites), ont €tĉ tres 
significatives dans chaque structure; mais Phĉterogenĉite a &t& plus ĉlevĉe quand on a 
utilise la structure de base (F=6,478; p«0,001) que quand on a employĉ la structure 
experimentale (F=5,050; p«0,01). En discriminant entre les series qui correspondent 
4 la structure de base, selon le nombre de lettres qui demandaient plus d'une seule 
emission de voix, on a pu dĉterminer que les sĉries 2 et 4 (6 lettres de cette classe dans 
chacune) ont denand& respectivement 5,76 + 0,96 et 5,95 = 0,84 secondes (F=1,360; 
p>0,05), tant que les series 1 et 3 (10 et 11 lettres avec ces caractĉristiques) ont 
demande 6,41 £ 1,18 et 6,21 = 0,92 secondes (F=1,599; p»0,05). La difference du 
temps pour les series 1 et 3 en moyenne par rapport aux series No. 2 et 4, a ĉtĉt tres 
significative (F=16,490; p<0,001), ce qui indique qu’une source importante de ’hete- 
rogenĉite de resultats obtenue avec la structure de base s'est due au nombre de lettres 
qui ont exig€ plus d'une seule ĉmission de voix. 


5. Conclusions 


e li est valable de substituer, dans le K.A.I., les series originales pour la lecture de 
lettres, par les series experimentales. 
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© La serie expĉrimentale permet de mesurer plus sensiblement la variable temps de 
lecture, avec une prĉcision majeure dans le diagnostic du BuL. 


e Nous offrons la possibilite d’adopter la structure B o expĉrimentale pour toute 


application ä des hispanophones. 
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Mezuro de la nundaüro kaj de la subjektiva tempokvanto surbaze de informfluo 
(Resumo) 


Tiu ĉi laboro konsistas el la esplorado de la inteligenteco pere de la aplikado de la testo KAI. 

Oni elektis aron da universitataj gestudentoj, kies aĝoj variis inter 18 kaj 28 jaroj. 

Oni intencis elpruvi ĉu la literserio komponanta la BUL-n de la originala verko, povis esti ansta- 
taŭita de alia literserio adap tita al hispanparolantoj. Hispanlingve, la prononcado de literoj per 
nura voĉdissendo permesas atingi rezultojn laŭ tiuj starigitaj ĉe la aritmoj de la aŭtoro ellaboritaj. 
Oni daŭrigas esploranta la interseriajn variancojn kaj la eblecon eltrovi la incidon de aliaj faktoroj 
en tiaj rezultoj. 











„ Offizielle Bekanntmachung 


Raporto de la Iniciatgrupo AIS de Eŭropa Klubo pri la plenumita preparlaboro cele la 
starigon de la Akademio Internacia de la Sciencoj (AIS) Sanmarino 


l. Komenco kaj evoluo 


La projekto AIS evoluis surbaze de la letero 
de prof.d-ro Frank de 1981-08-18 al profesor- 
ino Marina Michelotti (sekve al pli fruaj propo- 
noj liaj skribitaj al San Marino jam du jarojn an- 
taŭe). Tiun ĉi leteron profesorino Michelotti 
submetis en itala traduko al la ministrino por 
klerigado kaj kulturo, d-rino Fausta Morganti. 
Ekestis pri la propono unua interkonsiliĝo en 
San Marino la merkredon, 1981-11-25 inter 
d-rino Morganti, profesorino Michelotti, prof. 
d-ro Pennacchietti kaj prof.d-ro Frank. 

Dua renkontiĝo en RSM kun d-rino Morgan- 
ti okazis 1982-04-14. Ĝin partoprenis flanke de 
Eŭropa Klubo la gesinjoroj Argentino, Bozzini, 
Fantini, Formizzi, H.Frank, B.Frank-Bohringer, 
L.Frank, Marina Michelotti, Myriam Michelotti, 
Pennacchietti kaj Raffo. Illi verkis surloke deta- 
lan projektproponon kaj transdonis ĝin en ILo 
kaj la Itala al d-rino Morganti. Ni 

Post la akcepto de la propono far la stata 
kongreso de RSM 1983-05-19 denove okazis 
interkonsiliĝo kun d-rino Fausta Morganti 
(1983-07-11), pri kies rezulto ekzistas la kun- 
metita“ protokolo parte diskonigita itallingve 
per la n-ro 44 de NOTIZZIE STAMPA, Flanke 
de Eŭropa Klubo partoprenis ĉi tiun kvazaŭ 
„fondokunsidon“ de la AIS la gesinjoroj Cie- 
canti, Formizzi, Frank, Marina Michelotti, Pen- 
nacchietti kaj Terruzzi. Ne okazis la alvoko de 
la membroj de fondokomitato per leteroj, kiel 
antaŭvidite kaj menciite en la protokolo, sed 
prof.d-ro Frank transprenis la buŝe al li konfid- 
itan taskon, kunlabore kun eksterlandaj profe- 
soroj verki proponojn por statuto kaj ekzamen- 
regularoj, kaj serĉi alvokindajn kaj kunlabor- 
pretajn, elstarajn sciencistojn. La taskoj estas 
en kunlaboro kun la Iniciatgrupo AIS de Euro- 
pa Klubo plenumita je la interkonsentita lim- 
dato 1983-10-31. 

Okazis en San Marino de la 29a ĝis la 31a de 

.-oktobro 1983 denova renkontiĝo de la Iniciat- 
grupo de Eŭropa Klubo por oficiale fini la ak- 
ceptitan taskon kaj por detale prepari la 1-an 
Sanmarinan Universitatan Seancon. Tiun kun- 
sidon partoprenis la gesinjoroj Alberto kaj Mari- 
nella Balsimelli, Guido, Marina kaj MYriam Mi- 
chelotti, Piera Federici Raffo, Serenella Terruz- 
zi, Argentino, Ciccanti, Fantini, Formizzi, 
Frank, Pagliarani, Pennacchietti kaj Sammarini. 

La laborlingvoj de ĉiuj kunsidoj kaj de la 
koncerna korespondado estis la Itala kaj la In- 
ternacia kun reciproka tradukado. 


2. Membroj 


Estas rigardendaj kiel membroj de la Iniciat- 
grupo AIS de Eŭropa Klubo ĉiuj EKanoj, kiuj 
partoprenis aktive almenaŭ unu de la menciitaj 
kvar laborkunsidoj en RSM cele la starigon de 
AIS, t.e. Salvatore Argentino, Verona (I), Al- 
berta Gherardi Balsimelli (RSM), Marinella 
Balsimelli (RSM), Fiorenza Bozzini, Verona (1), 


Albino Ciccanti, Rimini (I), Rino Fantini, Ces- 
ena (I), Piera Federici Raffo, Chiavari (I), Gior- 
dano Formizzi, Verona (I), Helmar Frank, Pa- 
derborn (D), Ines Frank, Paderborn (D), Brigit- 
te Frank-Bohringer, Paderborn (D), Duilio Mag- 
nani, Rimini (I), Guido Michelotti (RSM), Ma- 
ria Luisa Michelotti (RSM), Marina Michelotti 
(RSM), Myriam Michelotti (RSM), Romeo Pag- 
liarani, Cesena (I), Fabrizio Pennacchietti, Tor- 
ino (I) kaj Serenella Giacchino Terruzi, Milano 
(1). - Krome prof.d-ro Frank havigis al si - kiel 
interkonsentite kun d-rino Fausta Morganti - la 
apogon de diversaj eksterlandaj sciencistoj 
(preskaŭ senescepte EKanoj) por starigi statut- 
kaj regularproponojn. 


3. Rezultoj 


Al la ministrino por klerigado kaj kulturo la 

Iniciatgrupo povas ek de hodiaŭ transdoni 

(a) statutproponon por AIS 

(b) proponojn por la ekzamenregularoj 

(c) interkonsentitan liston de alvokindaj kaj 
kunlaborpretaj sciencistoj 

(ĉ) rezolucion kun rekomendoj pri la estonta 
procedo FX 

(d) ĉi raporton. 

La Iniciatgrupo, plenuminte ĉi taskaron, plu- 

laboros 

- preparante la 1-an Sanmarinan Universitatan 
Seancon anoncitan per la n-ro 44 de Notizie 
Stampa por la tempo post kristnasko 1983 

- restante je dispono de la ministrino por kler- 
igado kaj kulturo por eventualaj pluaj inter- 
konsiliĝoj aŭ taskoj. 

San Marino, 1983/1683 pfR - 10 - 31. 

(Subskriboj de ĉiuj ĉeestaj Iniciatgrupanoj) 


* vd. grkg/Humankybernetik 2/83, p.93-94 
kk ĉi sekvas 





Rezolucio kaj rekomendoj de la Iniciatgrupo de 
Eŭropa Klubo por la starigo de AIS 
San Marino, 1983/1683pfR -10- 29 


La iniciatgrupo AIS de Eŭropa Klubo kunven- 
inta en San Marino de la 29a ĝis la 31a de okto- 
bro 1983/1683pfR decidis la jenan rezolucion 
kaj rekomendojn al la Ministrino pri Klerigado 
kaj Kulturo, d-rino Fausta MORGANTI: 


1) Ni konstatas, ke nek venis la iniciato por la 
fondo de la Akademio Internacia de la Sciencoj 
el la Esperanto-Movado, nek kontribuis ĝis nun 
iu Esperantista organizaĵo al la starigo de AiS, 
nek estu celo de AIS konkurenci kun la Akad- 
emio de Esperanto aŭ varbi por la Internacia 
Lingvo. Ĉi tiu lingvo (krome akceptata, ĉar efi- 
ka por modernaj informiloj, far kibernetikistoj) 
nur servas kiel unu el la oficialaj kaj laboraj lin- 


(daŭrigo: paĝo 192) 
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Ein Algorithmus zur Ähnlichkeits- 
untersuchung deutscher Vornamen 


von 


grkg/Humankybernetik 
Band 24 - Heft 4 (1983) 
Gunter Narr Verlag Tübingen 


Algoritmo por decido pri simileco 
de germanaj antaunomoj 


de 


Rudolf-Josef FISCHER , Münster (D) 


aus dem 


ella 


Institut für Medizinische Informatik und Biomathematik der Westfälischen Wilhelms-Universität 


(Direktor: Prof. Dr. F. Wingert) 


1. Problemstellung 


Täglich werden Hunderte von Patienten 
in den Universitätskliniken Münster aufge- 
nommen. Bei jeder Aufnahme muß kon- 
trolliert werden, ob zu dem Patienten 
schon Daten früherer Aufnahmen vorlie- 
gen. Diese Überprüfung ist Aufgabe der 


„automatischen Identifizierung“, die sich 
auch in vielen anderen Bereichen (Ein- 


wohnermeldeamt, Kundenkartei, usw.) 
ergibt. Für die Identifizierung werden An- 
gaben wie Geburtsdatum, Name, Vorna- 


me, . Geschlecht und Geburtsort verwen- 


det. 

Dabei muß berücksichtigt werden, daß 
diese Angaben fehlerhaft oder unvollstän- 
dig sein können. Oft gibt gerade ein Ver- 
gleich der Vornamen den Ausschlag, ob 
das Heranziehen weiterer Daten noch Er- 
folg verspricht. Dafür muß die Ähnlich- 
keit zweier Vornamen automatisch be- 
stimmt werden können. 


2. Der Begriff „Ahnlichkeit““ bei Vorna- 
men 


Im . Gegensatz zum Familiennamen 
kommt es bei Vornamen häufig vor, daß 


Münster 


1. Enkonduko 


Ciutage centoj da pacientoj estas akcepta- 
taj en la universitata klinikaro de Münster. 
Dum ĉiu akcepta proceduro oni devas 
kontroli, ĉu por tiu paciento jam haveblas 
datumoj de antaŭaj restadoj. Tiun kontro- 
lon faras la „aŭtomata identigo“, kiun oni 
ankaŭ aplikas sur multaj aliaj kampoj (en- 
loĝantara administrejo, klienta adresaro, 
ktp.) Por la identigo oni uzas informojn ' 
kiel naskiĝodaton, nomon, antaŭnomon, 
sekson kaj naskiĝlokon. 


Ce tio oni devas konsideri, ke tiuj infor- 
moj povas esti erarenhavaj aŭ malkomple- 
taj. Ofte ĝuste la komparo de la antaŭno- 
moj decidas, ĉu la uzo de pliaj datumoj 
ankoraŭ estas sukcespromesa. Pro tio la 
simileco de du antaŭnomoj devas esti aŭ- 
tomate kalkulebla. 


2. La nocio „simileco“ de antaŭnomoj 
Kontraŭe al familia nomo homoj ofte 


uzas ne la oficiale registritan formon de 
sia antaŭnomo, sed varianton. Oni devus 
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nicht die amtlich registrierte Form, son- 
dern eine Variante geführt wird. Es müß- 
ten also zu einem Vornamen alle seine 
Varianten als ähnlich erkannt werden 
können. Diese Varianten hängen stark 
von der Landessprache ab, zum Teil sogar 
mit regionalen Unterschieden. Deshalb ist 
der hier vorgestellte Algorithmus im we- 
sentlichen auf deutsche Vornamen zuge- 
schnitten, obwohl er auch bei ausländi- 
schen Vornamen oft ein richtiges Ergeb- 
nis liefert. 

Zwei vorgegebene Vornamen können ei- 
nen Ahnlichkeitsgrad von 0 bis 3 haben. 0 
bedeutet „keine Ähnlichkeit‘, 1 bis 3 ge- 
ben zunehmende Ähnlichkeit an. Die De- 
finition des Begriffes ‚Ähnlichkeit‘ bei 
Vornamen ergibt sich aus der Beschrei- 
bung des Ähnlichkeitsgrades. 

Allgemein gilt, daß zwei identische Vor- 
namen zwar den höchsten Ähnlichkeits- 
grad 3 erhalten, daß aber die Berechnung 
nicht besonders schnell ist, da man davon 
ausgehen sollte, daß nur bei zwei nicht 
identischen Vornamen eine Ähnlichkeit 
berechnet wird. 

Ferner gilt eine durch Schreibfehler ent- 
standene Variante nicht als ähnlich. Eine 
durch Schreibfehler definierte Ähnlich- 
keit läßt sich mit dem in (1) beschriebe- 
nen Algorithmus berechnen. 


3. Kriterien für den Ähnlichkeitsgrad 3 
Im folgenden werden zunächst Transfor- 
mationen beschrieben, mit denen Vorna- 
men zur Überprüfung von Ähnlichkeits- 
grad 3 verändert werden. Zu jeder Trans- 
formation wird ein ähnliches Vormamens- 
paar als Begründung angegeben. 

a) Streichen aller Leerzeichen und Binde- 

striche 


Beispiel: 


do aŭtomate rekoni ĉiujn variantojn de iu 
antaŭnomo kiel similaj al ĝi. Tiuj varian- 
toj tre dependas de la landa lingvo, parte 
eĉ de regiona. Tial la suba algoritmo taŭ- 
gas ĉefe nur por germanaj antaŭnomoj, 
kvankam ĝi liveras ankaŭ pri alilandaj 
antaŭnomoj ofte la ĝustan rezulton. 


Du donitaj antaŭnomoj povas havi simile- 
cogradon de 0 ĝis 3. 0 signifas malsimile- 
con, 1 ĝis 3 kreskantan similecon. La difi- 
no de „simileco“ de antaŭnomoj rezultas 
el la algoritmo, kiu kalkulas la simileco- 
gradon. 


Ĝenerale oni premisu, ke oni uzas la algo- 
riimon nur por malidentaj antaŭnomoj. 
Identaj kompreneble rezultigas simileco- 
gradon 3, sed la kalkulo ne estas specife 
rapida. 


Plie, varianto, kiu ekiĝis per skrib-eraro, ĉi 
tie ne rigardatas kiel simila. Skrib-erare di- 
finitan similecon oni povas kalkuli per al- 
goritmo el (1). 


3. Kriterioj por la similecogrado 3 

Unue mi sube priskribos kelkajn transfor- 
mojn, kiuj modifas antaŭnomojn por de- 
cidi pri similecogrado 3. Por ĉiu transfor- 
mo mi prezentas motivantan paron de si- 
milaj antaŭnomoj. 


a) Forigo de ĉiuj interspacoj kaj streketoj 


Ekzemplo: 


KARL HEINZ, KARLHEINZ 
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und kaj 
KARL-HEINZ 
sind ahnlich. estas similaj. 
b) TH wird durch T ersetzt b) TH anstataŭatas per T 
Beispiel: Ekzemplo: 


GUENTHER GUENTER 


c) PH wird durch F ersetzt 
Beispiel: 


c) PH anstataŭatas per F 
Ekezmplo: 


STEPHAN STEFAN 


d) CH wird durch C ersetzt 


d) CH anstataŭatas per C 


Beispiel: Ekzemplo: 
ERICH ERIC 
e) K wird durch C ersetzt e) K anstataŭatas per C 
Beispiel: Ekzemplo: 
MARK MARC 


f) Z wird durch C ersetzt 
Beispiel: 


f) Z anstataŭatas per C 
Ekzemplo: 


FRANZISKA FRANCISKA 


g) -L, -ER, -EL oder -CHEN am Ende 


wird gestrichen 


g) -L, -ER, -EL aŭ -CHEN finaj malaperas 


_ Beispiele: Ekzemploj: 
HEIN HEINER 
HANS, HANSEL 
und kaj 
HANSL 


FRITZ FRITZCHEN 


Ist nach diesen Transformationen einer 
der Vornamen im anderen als Teilzeichen- 
reihe enthalten, haben die beiden gegebe- 
nen Vornamen den Ähnlichkeitsgrad 3. 
Man beachte, daß die obigen Transforma- 
tionen keineswegs immer wie in den Bei- 
spielen zu einer gültigen Variante führen 
müssen. Entscheidend ist, daß der wich- 
tigste Wortteil übrig bleibt, der dann evtl. 
als Teilzeichenreihe in dem anderen Vor- 
namen vorkommt. 

Beispiel: 

Gegeben seien 


Se post tiuj transformoj unu el la du an- 
taŭnomoj estas subsignovico de la alia, la 
donitaj antaŭnomoj havas la similecogra- 
don 3. 

Oni atentu, ke la supraj transformoj ne 
ĉiam devas rezultigi validan varianton kiel 
en la ekzemploj. Ĉefe gravas, ke plej tipa 
nomparto restas, enhavate eble kiel sub- 
signovico en la alia antaŭnomo. 


Ekzemplo: 
Donitaj estu 


KAETHE KAETCHEN 


Die Transformationen führen zu: 


La transformoj rezultigas: 


KAETE KAET 


KAET ist Teilzeichenreihe von KAETE. 


KAET estas subsignovico de KAETE. Tial 


Also haben KAETHE und KAETCHEN KAETHE kaj KAETCHEN havas simileco- 
den Ähnlichkeitsgrad 3. 


gradon 3. 
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4. Kriterien für die Ahnlichkeitsgrade 2 
und 0 

Falls zwei gegebene Vornamen nicht den 

Ahnlichkeitsgrad 3 erreichen, werden sie 

weiter transformiert. 

a) Ein Vokal oder ein Y am Ende wird 
gestrichen 

b) AE wird durch A ersetzt 

c) OE wird durch O ersetzt 

d) In Vornamen, die nach diesen Trans- 
formationen noch mehr als 3 Buchsta- 
ben haben, werden aufeinanderfolgen- 
de Zeichen bis auf eines gestrichen. 


Falls die beiden Vornamen nach diesen 
Schritten weiterhin ungleich sind und ei- 
ner von ihnen weniger als 3 Buchstaben 
lang ist, werden die ursprünglichen Vorna- 
men als unähnlich festgestellt (Ähnlich- 
keitsgrad 0). Wenn sie jedoch beide noch 
mindestens 3 Zeichen lang sind und eine 
von ihnen in der anderen als Teilzeichen- 
reihe enthalten ist, haben die ursprüngli- 
chen Vornamen den Ähnlichkeitsgrad 2. 
Beispiele: 


4. Kriterioj por la similecogradoj 2 kaj 0 


Se du donitaj antaünomoj ne havas la si- 
milecogradon 3, ili plu transformatas. 


a) Fina vokalo aü Y malaperas 

b) AE anstataüas per A 

c) OE anstataüas per O 

d) Se antaŭnomoj post tiuj transformoj 
ankoraŭ havas pli ol 3 literojn, el ĉiuj 
apudaj identaj literoj restas nur unu. 


Se la du antaŭnomoj post tiuj proceduroj 
plu estas malidentaj kaj se unu el ili nun 
havas malpli ol 3 literojn, la originaj an- 
taŭnomoj estas malsimilaj (similecogrado 
0). Sed se ambaŭ an koraŭ havas minimu- 
me 3 literojn kaj se unu el ili estas nun 
subsignovico de la alia, la originaj antaŭ- 
nomoj havas la similecogradon 2. 


Ekzemploj: 


1) i AENNCHEN ANNA 


Transformation 3g führt zu: 


Transformo 3g rezultigas: 


AENN ANNA 
Kein Ahnlichkeitsgrad 3! Ne similecogrado 3! 
4a: | AENN ANN 
4b: ANN ANN 


4d unterbleibt, da nur noch 3 Zeichen üb- 
rig sind. Weil die transformierten Vorna- 
men nun gleich sind, haben die ursprüng- 
lichen den Ahnlichkeitsgrad 2. 


4d ne aplikatas, ĉar restis nur 3 literoj. 
Car la transformitaj antaŭnomoj estas nun 
identaj, la originaj havas la similecogradon 


2) HELMUTH HELLMUT 
3b führt zu: 3b rezultigas: 
HELMUT HELLMUT 
Ad: HELMUT HELMUT 
Es ergibt sich also Ähnlichkeitsgrad 2. Rezultas do similecogrado 2. 
3) KAY KAI 
4a führt zu: 4a rezultigas: 


KA KA 


Die beiden Vornamen haben nun zwar 


La du antaünomoj jes nun havas malpli ol 
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weniger als 3 Zeichen, sind aber identisch, 
so daß sie den Ähnlichkeitsgrad 2 erhal- 
ten. 


3 literojn, sed identas, kaj tial ricevas la si- 
milecogradon 2. 


4) JOCKEL JOCHEN 


3e und 3d führen zu: 


3e kaj 3d rezultigas: 


JOCCEL JOCEN 


3g führt zu: 3g rezultigas: 
JOCC JOCEN 
4d: JOC JOCEN 


JOCKEL und JOCHEN erhalten den Ahn- 
lichkeitsgrad 2, da JOC als Teilzeichenrei- 
he in JOCEN enthalten ist. 


5. Kriterien for die Ahnlichkeitsgrade 1 

und 0 
Falls die transformierten Formen zweier 
Vornamen auch nicht den Ahnlichkeits- 
grad 2 haben, wird geprüft, ob die Zei- 
chen der kürzeren in der längeren in der- 


‚selben Reihenfolge vorkommen. Falls ja, 


haben die ursprünglichen Vornamen den 
Ähnlichkeitsgrad 1; sonst sind sie unähn- 
lich (Ähnlichkeitsgrad 0). 

Beispiele: 


JOCKEL kaj JOCHEN ricevas la simileco- 
gradon 2, ĉar JOC estas subsignovico de 
JOCEN. 


5. Kriterioj por la similecogradoj I kaj 0 


Se la transformitaj formo de du antaŭno- 
moj ankaŭ ne havas la similecogradon 2, 
kontrolatas, ĉu la literoj de la pli mallon- 
ga estas samvice en la pli longa. Se jes, la 
originaj antaŭnomoj havas la similecogra- 
don 1; alikaze ili estas malsimilaj (simile- 
cogrado 0). 


Ekzemploj: 


1) HEINRICH HEINZ 


3d und 3f führen zu: 


3d kaj 3f rezultigas: 


HEINRICH HEINC 


Die Zeichen von HEINC kommen in der- 
selben Reihenfolge in HENRIC vor; also 
Ahnlichkeitsgrad 1. 


La literoj de HEINC aperas samvice en 
HEINRIC; do similecogrado 1. 


2) FRIEDRICH FRITZ 


3d und 3f führen zu: 


3d kaj 3f rezultigas: 


FRIEDRIC FRITC 


Die Zeichen von FRITC kommen nicht 
alle, nimlich das T nicht, in FRIEDRIC 
vor; also Unähnlichkeit, obwohl FRITZ 
eine Variante von FRIEDRICH ist. 


6. Genauigkeit des Algorithmus 


Natürlich kann man nicht erwarten, daß 
der Algorithmus in allen Fällen genauso 


El la literoj de FRITC ne ĉiuj, nome ne la 
T, estas en FRIEDRIC; do malsimileco, 
kvankam FRITZ estas varianto de FRIED- 
RICH. 


6. Precizeco de la algoritmo 


Kompreneble oni ne povas atendi, ke la 
algoritmo en ĉiuj okazoj same decidas pri 
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auf Ähnlichkeit entscheidet wie ein 
Mensch. Selbst für den Menschen gibt es 
Paare von Vornamen, bei denen die Mei- 
nungen auseinandergehen, ob der eine 
Vorname eine Variante des anderen ist. 
Der oben beschriebene Algorithmus geht 
davon aus, daß Varianten durch Erwei- 
tern oder Abkürzen einer Grundform ent- 
stehen. 

Männliche und weibliche Variante dersel- 
ben Grundform werden als ähnlich ange- 
sehen, weil, wie die Praxis zeigt, aus ei- 
nem fehlerhaft notierten Vornamen oft 
ein falsches Geschlecht abgeleitet wird. 
Die zweifache Berücksichtigung einer Ab- 
weichung im Geschlecht könnte eine zu 
geringe Wahrscheinlichkeit auf Identität 
zweier Personen vortäuschen und so eine 
Strategie der automatischen Identifizie- 
Yung zum Scheitern bringen. 


Bisher liegt eine nur kleine Stichprobe 
von Vornamenspaaren vor, die sich aus 
der Patientenaufnahme mehrerer Univer- 
sitätskliniken in Münster ergab. 

Insgesamt handelt es sich um 119 Fälle 
(siehe Tabelle 1), in denen zu derselben 
Person ein abweichendes Vornamenpaar 
vorkam. Da der Ähnlichkeitsalgorithmus 
auf Varianten deutscher Vornamen zuge- 
schnitten ist, müssen zunächst 16 Fälle 
von ausländischen Vornamen und 14 Fäl- 
le von Schreibfehlern ausgeklammert wer- 
den. Von diesen erkannte der Algorith- 
mus aber immerhin noch jeweils 7 Paare 
als ähnlich. Ferner kam 1 sonstiger Feh- 
ler, nämlich eine unzulässige Abkürzung 
(„B.“ für „BARBARA“) vor. Es verblei- 
ben also 88 Fälle, die einen Hinweis auf 
die Genauigkeit des Algorithmus erlau- 
ben. 

Davon wurden 79 als ähnlich erkannt. In 
9 Fällen versagte der Algorithmus, darun- 
ter allein viermal bei einem Paar DETLEF 
und DETLEV. Die Erfolgsquote beträgt 
also etwa 90%. 


simileco kiel homo. Sed eĉ por homoj ek- 
zistas antaŭnomaj paroj, pri kiuj oni mal- 
samopinias, ĉu el la du antaŭnomoj unu 
estas varianto de la alia. La supre prezen- 
tita algoritmo hipotezas, ke variantoj eki- 
ĝas kiel plilongaĵo aŭ kiel malplilongaĵo 
de baza versio. 


Porviraj kaj porvirinaj variantoj de la sama 
baza versio rigardatas kiel similaj, ĉar, kiel 
spertigas la praktiko, erara antaŭnomo 
poste povas konduki al miskorekto de la 
seks-indiko. La duobla konsidero de mal- 
identaj seksoj povus ŝajnigi maltro pro- 
bablan identecon de du personoj kaj mal- 
sukcesigi strategion de aŭtomata identigo. 


Ĝis nun haveblas nur malgranda samplo 
de antaŭnomaj paroj, kiu rezultis el la ak- 
cepta proceduro de pacientoj en pluraj 
universitataj hospitaloj de Münster. 

Estas entute 119 paroj (vidu tabelon 1) 
de identaj personoj kun malidentaj antaŭ- 
nomoj. Ĉar la algoritmo ĉi trovu nur va- 
riantojn de germanaj antaŭnomoj, oni 
unue ne konsideru 16 alilandajn parojn 
kaj 14 parojn kun skrib-eraro. El ili tamen 
la algoritmo eltrovis ne malpli ol po 7 si- 
milajn. Plie okazis 1 alia eraro, nome mal- 
permesita mallongigo (,B.“ anstataŭ 
„BARBARA“). Restas do 88 paroj, kies 
rezultoj vere rilatas al la precizeco de la 
algoritmo. 


El tiuj eltrovatis 79 similaj. 9-foje la algo- 
ritmo malsukcesis, el tiom jam 4-foje pro 
iu paro DETLEF kaj DETLEV. La suk- 
ceskvanto do estas ĉirkaŭ 90%. 
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Anzahlen Ähnlichkeitsgrad | nach zusätzlichem Einsatz 
; des Algorithmus nach [1] 
Vornamen nombroj similecogrado post kroma apliko 
antaŭnomoj de algoritmo laŭ [1] 
20 |=0 ähnlich | unähnlich 
similaj | malsimilaj 
Varianten 79 9 87 1 
variantoj 
deutsche Schreibfehler 7 7 13 1 
germanaj skrib-eraroj 
sonstige Fehler 1 1 
aliaj eraroj 
ausländische (Varianten oder 7 9 14 2 
Fehler) 
alilandaj (variantoj aŭ ' 
eraroj) | 
Summe 93 | 26 114 5 
sumo 
l 28 | 








Tabelle 1: Ergebnisse der Ähnlichkeitsun- 
tersuchung von 119 Paaren ab- 
weichender Vornamen identi- 
scher Personen ohne und mit 
zusätzlichem Einsatz des Algo- 
rithmus aus [1] 


In drei Fällen meldete der Algorithmus 
Ähnlichkeit bei abweichenden Vornamen 
nicht identischer Personen, aber nur in ei- 
nem dieser Fälle (HANS und HERMANN- 
JOSEF) lag offensichtlich ein Versagen 
der Ähnlichkeitskriterien vor. 

Um zwei Personen zu identifizieren, kann 
man für als unähnlich gemeldete Vorna- 
men zusätzlich einen Algorithmus aus FI- 
SCHER (1982) einsetzen, der überprüft, 
ob die Unähnlichkeit auf Schreibfehlern 
beruht. Dieser Algorithmus erkannte von 


tabelo 1: rezultoj de decido pri simileco 
ĉe 119 paroj da malidentaj an- 
taunomoj de identaj personoj, 
sen kaj kun kroma apliko de la 
algoritmo laŭ [1] 


3-foje la algoritmo anoncis similecon de 
malidentaj antaŭnomoj de malidentaj per- 
sonoj, sed nur 1-foje (HANS kaj HER- 
MANN-JOSEF) tio signifis senduban mal- 
funkcion de la similec-kriterioj. 


Por identigi du personojn, oni povas por 
antaŭnomaj paroj, ĝis tiam kiel malsimilaj 
konstatitaj, apliki krome algoritmon laŭ 
FISCHER (1982), kiu kontrolas, ĉu la 
malsimilecon kaŭzis skrib-eraroj. Tiu al- 
goritmo malkovris, ke inter la restintaj 9 
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den restlichen 9 ausländischen Vorna- 
menspaaren 7 als ŝhnlich, obwohl ohne 
Kenntnis der Bildungsgesetze für Varian- 
ten bei auslindischen Vornamen nicht 
entschieden werden konnte, ob es sich 
wirklich um Schreibfehler und nicht viel- 
mehr um Varianten handelte. Von den 
verbliebenen 7 Fällen von Schreibfehlern 
erkannte das Verfahren aus FISCHER 
(1982) 6 als ähnlich. Bei dem 7. Fall 
(KAY und KAZ) war der Vorname 
KAY zu kurz, als daß man per Algorith- 
-mus KAZ als Schreibfehler hätte be- 
haupten können. 


Bei zusätzlichem bedingtem Einsatz des 
Algorithmus aus FISCHER (1982) wur- 
den also insgesamt von den 119 Fällen 2 
ausländische Vornamenpaare, 1 Schreib- 
fehler, 1 sonstiger Fehler und nur 1 wei- 
terer Fall (MARLIES und MARIA- 
ELISABETH) nicht als ähnlich erkannt. 


Durch Fortschreiben dieser Statistik und 
damit durch Vergrößern der Stichprobe 
wird sich überprüfen lassen, ob das obige 
Ergebnis schon eine zuverlässige Schät- 
zung der Genauigkeit darstellt. Falls wei- 
terhin Paare wie DETLEF und DETLEV 
vermehrt auftauchen, könnte dieses noch 
zu einem Abändern der Kriterien für die 
Ähnlichkeitsgrade führen. 


Schrifttum 


alilandaj antaŭnomaj paroj estis 7 similaj, 
kvankam oni sen scio pri la ekig-reguloj 
por variantoj de alilandaj antaŭnomoj ne 
povas decidi, ĉu temis fakte pri skrib- 
eraroj aŭ kontraŭe pri variantoj. El la 
restintaj 7 paroj kun skrib-eraroj la algo- 
ritmo el FISCHER (1982) ekkonis, ke 6 
estis similaj. La nomoj de la 7-a paro 
(KAY kaj KAZ) estis tro mallongaj por al- 
goritme aserti, ke KAZ estas skrib-eraro 
de KAY. 


Do, post kroma laŭbezona apliko de la al- 
goritmo laŭ FISCHER (1982) el la 119 
paroj entute restis 2 alilandaj, 1 skrib-era- 
ra, 1 ali-erara kaj nur 1 lasta (MARLIES 
kaj MARIA-ELISABETH) laŭalgoritme 
malsimilaj. 


Post daŭrigo de tiu statistika nombrado 
kaj do per la tiel kreskanta samplo kon- 
troleblos, ĉu la supra rezulto jam estas fi- 
dinda stimaĵo de la precizeco. Se paroj 
kier DETLEF kaj DETLEV plue aperas 
sufiĉe ofte, tio povus konduki al ŝanĝo de 
la similec-kriterioj. 


Literaturo 


FISCHER, Rudolf-Josef: Trovado de similaj vortoj en ampleksa vortaro. En: H.Frank/Y ashovar- 
dhan/B.Frank-Böhringer (eld.): Lingvokibernetiko, Tübingen 1982, Gunter Narr 


Eingegangen am 


Ricevita je 


1983-07-01 


Anschrift des Verfassers: 


Adreso de la aŭtoro: 


Dr. Rudolf-Josef Fischer, Institut für Medizinische Informatik und Biomathematik der 
Westfälischen Wilhelms-Universität Münster, Hüfferstr. 75, D-4400 Münster 





Algoritmo por decido pri simileco de germanaj antaunomoj 191 





An algorithmus for measuring the similarity of German names (summary) 


The admission procedure at the Münster University Hospital stipulates that for each newly admit- 
ted patient one must check whether any records of previous admissions exist. This check is carried 
out by means of an algorithmus for “automatic identification’’ which compares date of birth, sur- 
name, given name, sex and possibly place of birth. One must also take into account the fact that 
some of these data may be incomplete or erroneous. The decision whether to carry on with the 
search often rests just on the comparison of given names. For this purpose the degree of similarity 
between given names must be made automatically measurable. 

In place of the officially registered form of their given names people often use variants, so all one 
needs is to automatically “recognise”” all variants of a certain name as being similar to its “official” 
form. For our purpose we define 4 degrees of similarity ranging from 0 to 3. 0 implies non-identity, 
1 to 3 increasing degrees of similarity. The definition of similarity is a direct consequence of the 
algorithm used to measure it; in fact it decreases according to the number of transformations requi- 
red to acheive identity. These transformations take into consideration the usual ways of abbrevia- 
ting German names and of attaching dimunitive suffixes to them. In spite of this one acheives good 
results even when dealing with non-German names. 

A test showed a success-rate of about 90% and the additional application of an algorithm fo loca- 
ting type-errors increased this to approximately 99%. 























Offizielle Bekanntmachung 


Raporto de la Iniciatgrupo AIS (daŭrigo de pago 1 82) 


gvoj de. AIS. La Internacia Lingvo tamen estas 
nemalhavebla komunikilo de AiS pro la neŭtral- 
eco de San Marino kune kun la fakto, ke junaj 
sciencistoj de orienteŭropaj landoj multe pli fa- 
cile ol en la Angla aŭ la Franca esprimiĝas en la 
Rusa lingvo, kiu inverse malofte estas kompren- 
ata far la okcidenteŭropaj sciencistoj. - Por ke 
ne ekestu ajna miskompreno pri la nur rimeda 
rolo de la Intemacia Lingvo en AIS, ni insiste 
rekomendas eviti en ĉiuj oficialaj tekstoj kaj 
gazetarinformoj rilate AIS la kromnomon „Es- 
peranto“ de la Internacia Lingvo sed uzi nur ĉi 
tiun originalan nomon, eventuale mallongigite 
kiel I.L. aŭ ILo. 


2) Ni konstatas, ke laŭ interkonsento de 1983- 
07-11 inter la iniciatgrupo kaj. la ministrino pri 
klerigado kaj kulturo estis verkita 1983-07-27 
unua propono de statuto kiel bazo de koncernaj 
diskutoj kun eksterlandaj universitataj profeso- 
roj, precipe inter profesoro Frank (D) kaj la 
profesoroj Bociort (R), Cen (TJ), Formizzi (I), 
Haszpra (H), Lapenna (GB), Marinov (BG), 
Neergaard (DK), Pennacchietti (I), Sangiorgi 
(BR) , Sherwood (USA), Szerdahelyi (H) kaj 
Weltner (D), sed - skribe - ankaŭ kun pluraj 
aliaj sciencistoj. Surbaze de la diversaj ŝanĝgpro- 
ponoj la profesoroj Frank kaj Pennacchietti ver- 
kis en ILo kaj la Itala ĝustatempo la promesitan 
proponon por la Ministrino pri Klerigado kaj 
Kulturo kun dato 1983/1683pfR-09-26, kom- 
postis kaj storis sur magnetkartojn la proponon 
por poste ebligi rapidajn ŝanĝojn, kaj tuj presigis 
kelkdek ekzemplerojn por la ministrino, la 
membroj de la iniciatgrupo kaj la kunlaborintaj 
sciencistoj. Publikigo ankoraŭ ne okazis kaj ne 
okazu antaŭ la permeso far la ministrino. - La 
iniciatgrupo rekomendas la akcepton de la sta- 
tutpropono kun la jenaj esceptoj: 

a) en $5.1 estu inter$ovita inter „kibernetikajn“ 
kaj „kaj la prikulturajn“ la klaŭzo „la prinatu- 
rajn (precipe la biologiajn kaj ekologiajn)““ 

b) en $9.3 la klaŭzoj „kolegianoj, inter kiuj mi- 
nimume du estas“ kaj „laŭ elekto de la aparte- 
nantoj“ estu forstrekitaj. Estu aldonata: „De- 
komence funkciu la jenaj tri sekcioj: Kiberneti- 
ko (provizore kun filozofio), kultursciencoj 
(provizore kun morfosciencoj) kaj natursciencoj 
(provizore kun struktursciencoj)“ 2 

Ni rekomendas, tuj post la akcepto far la Stata 
Kongreso publikigi la statuton Itale (kaj laŭeble 
ILe) en Civilta“ Cibernetica, kaj ILe (kaj laŭeble 
angle aŭ france) en grkg/Humankybermetik. 


3) Ni konstatas, ke ankaŭ por la tri ekzamenre- 
gularoj tuj (jam en la julio) estis verkataj unuaj 
skizoj kiel diskutbazoj, kaj ke bontempe antaŭ 
la limdato interkonsentita kun la ministrino pri 
klerigado kaj kulturo la 11-an de julio la skizoj 
estis transformataj en proponojn transdonotajn 
al la ministrino. La tekstoj - ĝis nun same kiel 
en la kazo de la statuto nur etkvante presitaj 
por la ministrino, la iniciatgrupo kaj la kunlabo- 
rintoj - troviĝas sur magnetkartoj, tiel ke ŝanĝoj 
kaj presigo rapide eblas post akcepto. - Ni reko- 
mendas, ke almenaŭ la regularo por la docent- 
iĝo estu decidata jam kune kun la statuto, por 
ke AIS povu eklabori. (...) 


4) Transprenante la taskon menciitan en $9.2 

de la statutpropono kaj aprobinte la kriteriojn 

starigitajn far la profesoroj Frank kaj Pennac- 

chietti, ni rekomencas al la ministrino pri kler- 

igado kaj kulturo la alvokon de 

a) la universitatnivelaj profesoroj sur la listo 
4.1(1.1) kiel honoraj profesoroj kaj dum- 
vivaj sciencaj senatanoj 

b) la universitatnivelaj profesoroj sur la listo 
4.1(2.1) kiel honoraj profesoroj kaj asociitaj 
membroj 

c) la meritplenaj elstudintaj sciencistoj sur la 
listo 4.1(2.3) kiel adjunktoj 

ĉ) la meritplenaj subtenantoj sur la listo 4.1(3) 
kiel konsilantoj. 


5) Ni decidis transpreni la organizan respondec- 
on por la okazigo de 1-a Sanmarina Universitata 
Seanco (SUS) de la 27a de decembro ĝis la 7a de 
januaro 1683pfR, en kies kadro povas okazi la 
Inaŭguro de AIS, se tion volas la registaro de 
RSM. Ni petas niajn membrojn en San Marino, 
Sinjorinoj Marina kaj Myriam Michelotti, surlo- 
ke preni ĉiujn necesajn iniciatojn kaj precipe 
sendi la necesajn oficialajn invitleterojn al la 
partoprenontoj. Laŭ la volo de la ministrino pri 
klerigado kaj kulturo AIS povas lastminute far- 
iĝi la oficiala okaziganto de la tuta 1-a SUS aŭ 
de parto de ĝi. 


6) por ne seniluziigi la elstarajn sciencistojn el 
la tuta mondo, kiuj entuziasme aprobas AIS, ni 
samopinias, ke ia konstituigo de AIS devos oka- 
zi dum la unua SUS, kiel anoncite por la semaj- 
no post kristnasko 1983 per la Notizie Stampa 
n-ro 44 de la 13a de julio 1983. Tamen estas 
kvar diversaj ebloj plenumi ĉi tiun deziron: 
I) Se la Ŝtata Kongreso laŭplane antaŭ la 19a 
de novembro decidas statuton de AIS kaj. rajtig- 
as la Ministrinon pri Klerigado kaj Kulturo al- 
voki la unuajn membrojn, AIS povos plenforte 
ekfunkcii per aŭ dum la unua SUS. 
II) Se la Stata Kongreso ankoraŭ ne decidas 
statuton sed ja konkretigas la fondodecidon de 
la 19a de majo per la rajtigo al la Ministrino pri 
Klerigado kaj Kulturo alvoki la unuajn memb- 
rojn, tiuj ĉi povos kontitui dum la unua SUS la 
Akademion kaj transpreni la taskon rediskuti 
kaj - konforme al direktivoj donotaj far la mi- 
nistrino - revizii niajn statut- kaj regularpro- 
ponojn. _ 
III) Se la Stata Kongreso ne decidas statuton 
kaj prokrastas la inaŭguron de AIS al difinita 
dato, tiam la alvokindaj sciencistoj menciitaj 
sur la kunmetitaj listoj povos dum la unua SUS 
konstituiĝi kiel provizora Kolegio de AIS kaj 
plenumi necesajn preparlaborojn, pli-malpli 
apogante sin sur nian statutproponon. 
IV) Se la Stata Kongreso nek decidas statuton, 
nek rajtigas la Ministrinon tuj alvoki la unuajn 
membrojn, nek prokrastas la planitan inaŭguron 
al difinita dato en la venonta jaro, tiam la sci- 
encistoj sopirantaj al la ekesto de AIS memstare 
ĝin povos konstitui dum la unua SUS kaj poste 
peti la agnoskon fare de la Respubliko de San 
Marino. 

(Unuanime akceptita) 


(Außerhalb der redaktionellen Zuständigkeit) 
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